본문 바로가기
반응형

분류 전체보기285

논어 : 여자 배구선수들은 왜 논어를 읽었을까 이다현 선수가 논어덕질에 입문시켜주다 최근 현대건설 이다현 선수가 인터뷰 중 논어에 대한 이야기를 하는 것을 듣고 마음을 울리는 부분이 있어서 논어를 읽게 되었다. (양효진 선수가 원조 논어 팬이라고 한다. ㅋㅋㅋ) 프로배구 선수로서 멘탈이 흔들릴 때도 많은데 논어의 구절들을 곱씹으면서 좋은 경기력을 유지해나가는 것 같다. 어떤 논어를 고를까? 사실 논어 읽기는 과거에도 시도했던 적이 있다. 하지만 기존 논어 해석본은 읽다가 포기했는데 그 이유는 한국말은 한국말인데 도대체 마음에 와닿지 않았기 때문이다. 예를 들어 논어에 '덕불고 필유린(德不孤 必有隣)'이라는 구절이 있는데 직역하면 '덕이 있는 사람은 반드시 따르는 사람이므로 외롭지 않다.'라는 뜻이다. 대충 무슨 말인지를 알겠는데 '덕(德)'이라는 말.. 2022. 2. 12.
개인화 추천 알고리즘 5 : TD-IDF 모델로 유사도 분석하기 TD-IDF 를 활용한 유사도 분석 지난 유사도 분석에서는 문서의 각 단어를 벡터화하여 문서 간의 유사도를 구해보았다. TF-IDF 는 이전 보다 더 정교한 모델로, TF(Term Frequency)는 단어빈도를 의미하며 전체 문서에서 특정단어가 얼마나 자주 등장하는 지를 의미하며, IDF(Inverse Documnet Frequency)는 역문서 빈도를 의미하며 쉽게 말해 너무 자주 나오는 단어는 덜 중요하다고 간주하여 패널티를 주는 것이다. 다시 한 번 정리하면 TF-IDF는 "다른 문서에서는 등장하지 않지만 특정 문서에서만 자주 등장하는 단어를 찾아내 문서 내 "중요한" 단어의 가중치를 계산하는 방법"이다. TF(d,t) : 특정 문서 d에서 특정 단어 t의 등장 횟수 DF(t) : 특정 단어 t가.. 2022. 2. 8.
개인화 추천 알고리즘 4 : 컨텐츠 기반 모델과 코사인 유사도 함수 유클리디안 유사도 (Euclidean Similarity) 유클리디안 유사도는 문서간의 유사도를 계산하는 가장 기본적인 방식이다. p 벡터와 q 벡터의 거리를 구하는 것으로 우리가 중학교 때 배웠던 2차원의 피타고라스 정리를 생각하면 쉽게 이해할 수 있다. (피타고라스 정리는 90도 직각인 경우에 성립하므로 2pq는 0이므로 아래 공식이 성립한다.) 유클리디안 거리는 벡터간의 절대적인 거리에 초점을 맞추고 있기 때문에 벡터가 서로 다른 방향이더라도 유사도가 높다고 판단한다. 아래 이미지에서 메시와 호나우두는 벡터의 방향성은 다르지만 절대적인 거리가 가까우므로 유사하다고 보는 것이다. 코사인 유사도 (Cosine Similarity) 코사인 유사도는 코사인 값이 얼마나 유사한지, 다시 말해 벡터의 방향이 .. 2022. 2. 8.
개인화 추천 알고리즘 3 : 컨텐츠 기반 모델과 유사도 함수 콘텐츠 기반 추천 알고리즘 개인화 추천 알고리즘에 가장 기초적인 형태는 앞서 언급한 연관분석(Apriori, FP-growth)이다. 연관분석은 이재호님의 글에서 좋은 이미지가 있어서 가져 왔는데, 주로 상품추천이나 상품배치에 많이 사용된다. 상품 추천 이외에도 컨텐츠를 추천해주는 방법론은 컨텐츠 기반 추천(Contents-based recommendation)이라고 한다. 사용자가 본/읽은 것과 유사한 컨텐츠를 찾아서 추천해주는 기법으로 유사도(similarity)가 높은 컨텐츠를 찾아내는 방식이다. 이 과정에서 컨텐츠를 벡터화(Vectorization)하여 유사도를 측정한다. 유클리디안 유사도 유클리디안 유사도는 문서간의 유사도를 계산하는 가장 기본적인 방식이다. p 벡터와 q 벡터의 거리를 구하는 .. 2022. 2. 7.
개인화 추천 알고리즘 2 : FP-Growth FP-Growth 왜 나왔을까? 이전 포스팅에서 Apriori 알고리즘에 대해 알아보았다. Apriori의 가장 큰 단점 아이템셋의 수가 증가할 수록 메모리를 많이 먹고 속도가 느려진 다는 것이다. FP Tree도 기본적으로 연관분석의 하나이며 Apriori와의 차이는 FP-Tree를 생성한 후에 최소 지지도 이상의 패턴만을 추출한다는 것이다. FP tree는 아이템 별로 노드를 추가하면서 트리를 생성하는 과정이다. FP Tree를 생성하는 방법은 아래 블로그에 잘 설명되어 있다. (너무 유익한 내용 감사드립니다. ㅠ) https://process-mining.tistory.com/92 FP-Growth 사례 원핫 인코딩을 통해 데이터프레임을 생성하는 절차는 Apriori 와 동일하다. import ml.. 2022. 2. 6.
개인화 추천 알고리즘 1 : Apriori 알고리즘 우리 안의 수많은 추천 시스템 추천 시스템은 사용자, 구매자에게 상품을 제안하는 방법론을 말한다. 이것은 쇼핑몰에서 어떤 상품을 추천할 것인지 음악 어플에서 어떤 음악을 추천할 것인지 뉴스피드에서 어떤 뉴스를 추천할 것인지 등 광범위하게 쓰이고 있다. 홈페이지나 어플 이용자들은 어느 상품에서 몇 분동안 머물렀는지, 어떤 상품을 클릭했는지, 실제로 구매로 이어졌는지에 대한 수많은 로그를 남기고 기업들은 이 로그들을 중요한 데이터 자원으로 추천 시스템에 활용한다. 쿠팡에서 내가 특정상품을 보면 그 패턴을 토대로 추천 상품 리스트를 뿌려주는 것을 쉽게 볼 수 있는데 이것이 바로 개인화 추천 알고리즘이다. 최근에 인테리어 때문에 식탁보를 구경한 적 있는데 이 로그 기록을 바탕으로 유사성이 높은 식탁보를 계속 뿌.. 2022. 2. 6.
논어 읽는 배구선수(?) 이다현 선수를 온 마음으로 응원하며 논어 읽는 배구선수 이다현 올해부터 브이리그에 입문하여 덕질을 하고 있다. 사실 덕질에 입문하게 해준 선수는 황민경 선수로 인터뷰를 할 때마다 얼마나 깊은 생각을 하면 저렇게 말을 잘 할까 라는 생각을 많이 할 정도다. 황민경 선수에 이어 또 다른 덕질에 입문한 선수는 바로 센터 이다현 선수다. (양효진과 함께 높은 블로킹의 벽인 '통곡의 벽'을 담당하고 있다.) 최근 이다현 선수를 눈여겨 보게 되었던 것은 바로 양효진 선수와의 인터뷰 중 나왔던 논어의 유명구절에 대한 것이었다. 대부분의 운동선수들도 그렇겠지만 자기만의 철학을 가진 운동선수들이 되게 멋있는 선수라고 생각했는데 통곡의 벽 두 센터들 모두 지성과 지혜로 머리가 꽉꽉 찬 그런 선수들이었던 것이다!! 자신의 한계를 스스로 정하지 말라 이야기를 .. 2022. 2. 5.
나는 매주 시체를 보러간다 : 삶에서 죽음을 생각하다 법의학자 유성호 교수님의 죽음에 관한 이야기 법의학자 유성호 교수님은 처음에 유튜브를 통해서 알게 되었다. 차분히 말씀하시는 모습도 좋았고, 우리에게 생소한 법의학이라는 것은 무엇이고 우리 사회에서 법의학이 어떤 역할을 하는지 이야기해주시는 게 인상깊었다. ​ https://www.youtube.com/watch?v=g-w_9J62rnM ​ 죽음을 생각하는 이유 : 삶을 소중히 하기 위해서 ​ "삶의 마지막 순간에 자신이 어떠한 모습이 기를 바라는 끊임없이 묻고 답하는 과정에서 우리의 삶은 더욱 풍성해지고 깊은 의미를 담는다." ​이 책은 법의학과 죽음에 대한 유성호 교수님의 생각을 알기 쉽도록 쓴 책이다. 어쨌든 법의학자라는 사람은 역설적으로 인간이 죽어서야 만날 수 있는 사람이기 때문에 죽음과 관련된.. 2022. 2. 5.
[동남아 3편] 미얀마(버마) 2 : 바간. 여기는 무슨 파고다? 바간 : 어디가 어디인지 기억이 안 날 정도로 많은 불교 유적 바간은 미얀마 최대 불교 유적지이다. 우리나라로 치면 고려왕조(11세기 정도)때 지어진 불교 건축물이라고 할 수 있다. 그 사원의 수가 2000개가 넘을 정도로 엄청난 유적지이다. 원나라의 지배를 받게 된 고려와 동일하게 당시 버마왕조도 쿠빌라이 칸의 항복을 거절하고 왕조가 무너지게 된다. 왕조가 무너졌지만 당시 스리랑카, 태국, 크메르(캄보디아) 등지에서 불교 교류가 많았다고 한다. 그래서 그런지 바간에서는 우리나라와 같은 대승불교에서 볼 수 없는 소승불교 유적지들이 상당히 많다. 사원(temple)과 파고다(pagoda)의 차이점은 쉽게 말하면 사원은 스투파(stupa)가 없는 사원이고, 파고다는 스투파(stupa)가 있는 사원이다. 스투.. 2022. 2. 2.
대화의 내용이 중요하지 않다. (INFP 인프피의 단상) 대화의 내용이 중요하지 않다 나는 대학교 시절 부터 이것에 대해 되게 많이 생각했다. 우리도 하루에도 수 많은 대화를 한다. 매일 일어나는 일상부터 인생의 철학적인 이야기까지. 상대방이 대화내용보다 '대화를 재미있게 했다.' 라는 느낌이 마음 속에 남는 게 가장 중요하다는 것이 이 글의 주제다. 대학교 때 나는 보수 정치인들을 매우 싫어했다. 딱히 이유가 있었던 것은 아니고 대학교 때 대학이라는 나의 생활공간에서 일어나는 권위주의들이 보수정치의 산물이라고 막연히 생각했기 때문이다. 그래서 한 번은 중학교 친구와 정치 이야기로 다투고 그 이후로 연락을 안 하게 된 적이 있다. 사실 그 정치인들이 밥을 먹여주는 것도 아닌데 뭘 이렇게 무의미하게 다퉜나 후회를 참 많이 했다. 그런 일련의 실수들을 반복하고 나.. 2022. 2. 2.
반응형