3월, 2015의 게시물 표시

국내 커뮤니티가 발렌타인데이를 대하는 모습 #2

이미지
머릿글 1편 굳이 그래프를 보여가며 구구절절 설명하지 않아도 당연히 분위기에 따라 특정 주제의 글이 평소보다 더 자주 등장하기 마련이다. 그리고 비슷한 얘기가 계속 올라오면 사람에 따라서 짜증이 나기도 하고, 그래서 의도적으로 무시를 하기도 한다. 정말 흥하는 주제라면 너도 나도 그 글을 클릭할 것이고 댓글을 다는 행동을 통해 스스로 커뮤니티 구성원임을 확인하고 대세에 동참했다는 뿌듯함을 느끼기도 할 것이다. 발렌타인, 커플 관련 주제는 부러움, 혹은 시기의 대상이 될 수도 있다. 따라서 의도적으로 클릭하지 않는 사람도 유의미하게 있지 않을까 하는 추측을 해본다. 제 3자의 입장이 아니라 그런 내부인의 시각 으로 사람들의 반응을 살펴보자. 빨간색은 발렌타인데이 관련 글이 차지하는 조회 수 비중을 나타내고 파란색은 그렇지 않은 글의 조회 수 비중이다. 커뮤니티별로 확실한 차이가 있는거 같다. 오유 , 듀나 , 여시 , 웃대 회원은 발렌타인데이 관련 글을 더 클릭했다. 알싸 는 그런거 없이 일단 글 올라오면 공평하게 다 눌러보는 듯... -ㅅ- 그리고 쭉빵 부터 네이트판 까지 다른 모든 커뮤니티 회원은 발렌타인데이 관련 글을 의도적 으로 외면하고 있다. 네이트판 은 발렌타인데이가 정말 싫은가 보다;; 그럼 댓글 이 달리는 차이도 덩달아서 많고 적고 그런가? 댓글이 달리는 양상도 커뮤니티별로 확연히 차이가 난다!!! 궁금해서 클릭은 했지만 댓글은 남기고 싶지 않아! 라는 커뮤니티( 오유 )가 있고, 조회수는 낮은데 댓글이 폭발하는 커뮤니티( 뽐뿌 )도 있다. 알싸 는 댓글에서도 차별없이 공평하다. 네이트판 은 발렌타인데이라면 질색인건가?;;; 조회 수, 댓글 수 모두 정직하게 높은 듀나 . 이 와중에 파코즈는 댓글 데이터가 사라졌네 ㅠㅠ 어떻게 된건가;; 조회 수와 댓글 수의 상관 관계를 확인해보자. 자세한 내용은 그래프를 클릭. 파코즈는 댓글이 날아갔으니까 눈으로 필터링 ㅠㅠ 발렌타인데이가

국내 커뮤니티가 발렌타인데이를 대하는 모습 #1

이미지
우선, 오늘의 선수들 소개. 랜덤 순서. 작성자가 회원인 커뮤니티도 있고 아닌 커뮤니티도 있음을 미리 밝히며, 커뮤니티 소개는 잘못했다간 어그로를 끌 수도 있으니 패스. 대부분은 이름은 들어본 적이 있는 커뮤니티일거라 생각한다. 앞 얘기가 궁금한 분은 여기 를 먼저 보고 와도 좋다! 클리앙, clien 오늘의 유머, 오유, ou 웃긴대학, 웃대, humoruniv 베스티즈, bestiz 루리웹, ruliweb 아이러브사커, 알싸, 알럽사커 82쿡, 82cook 뽐뿌, ppomppu 듀나의 영화게시판, 듀게, 듀나, djuna 보배드림, 보배, bobaedream 여성시대, 여시 pgr21 쭉빵 네이트판, pann 파코즈, parkoz 이상 15개 커뮤니티를 대상으로 진행한다. 여기 없는 커뮤니티는 내가 모르는 곳이거나, 크롤링이 귀찮게 되어 있거나, 정줄놓고 막 긁어오다가 밴 당했거나, 그것도 아니면 잉여력이 미처 닿지 못했기 때문이다. 모든 게시물을 긁지는 못하고, 일반적으로 말하는 '자유게시판'과 유사한 성격의 게시판을 1순위로, 그런 곳이 없거나 올라오는 글이 안습인 경우에는 커뮤니티의 대표 게시판을 하루에 한번씩 모았다. 글쓴이와 관련된 정보는 긁지 않았으며 , 올라온 날짜(시간), 댓글 수, 조회 수도 함께 모았다. 데이터를 들여다보는 방법은 발렌타인데이, 화이트데이, 커플/솔로, 외로움 관련 내용의 출현 빈도를 기본으로 하고 가급적 커뮤니티별 비교는 피하려 했지만 이렇게나 모아놓으면 별 수 없자나? ...그래도 막 그래프를 한 곳에 겹쳐놓고 이거 봐라 얘네가 다른 곳이랑 비교해서 어쩌고 저쩌고 하지는 않는다. 혹시나 이거보고 커뮤니티끼리 싸우는 일은 없었으면 좋겠다. 보면 알겠지만 우린 어차피 다 마찬가지야. 하아. 일부만 관심이 있겠지만 사용한 소프트웨어를 잠깐 언급만 하고 넘어가자. Python 3.4, mongodb 3.0, pandas 0.15.2, IPython 3.0

[예고] 발렌타인데이와 국내 커뮤니티의 모습

이미지
지난 2월 13일. 발렌타인데이를 하루 앞두고 쓸데없는 잉여병이 또 도져서 각 커뮤니티가 발렌타인 데이를 맞이하는 모습을 알아보려고 개인 장난감 공개 용으로 만들어 둔 페이스북 페이지, 프로글래머 에 이런 글을 투척하고는 국내 커뮤니티 게시판을 크롤링하기 시작했다. 발렌타인데이가 지나가고, 본격적으로 삽질을 시작. 존잘님과 비교하면 나는 개뿔 기술도 없고 데이터에 대한 인사이트도 허접해서 어설프게 '빅데이터'니 '데이터 분석'이니 하는 버즈워드를 함부로 갖다 쓰다간 본전도 못 찾고 영혼까지 탈탈 털리므로, 쌈마이 모드로 가기로 한다. -_- 2월 1일 데이터부터 수집하려고 했는데, 이게 뭐라고 하다보니 또 욕심이 도져서;; 작년 크리스마스가 끝난 2014년 12월 26일부터 수집하기로 하고 광속 크롤링. 이것도 작은 이야깃거리는 하나 나올텐데, 별로 영양가는 없으므로 패스하기로 한다. 2월 15일까지 모은 데이터. 근데 뭘 좀 해보려고 하니 설 연휴가 코앞이네. 오피셜하게는 백수니까 귀성길 정체를 피하기 위해 일찍 고향으로 내려갔다. 어차피 집에서 뭔가를 한다는건 불가능이니 크롤링 사이트나 2개 더 추가하고... 잊었다. 결국, 화이트데이가 다가오고 나서야 생각이 나는데, 어차피 이렇게 된거 화이트데이까지 엮어서 세트로 해보기로 결ㅋ정ㅋ. 크롤링은 잘 돌고 있었나, 데이터 확인. 으음.... 어쨌든 늘긴 늘었군. 좋아 그럼 게임을 시작하지.

python3.4 pip install fail

python3.4 환경에서 pip install 이 실패하는 문제가 좀 전에 생겼다. 제일 의심스러운 건 얼마 전에 jupyter 를 써보겠다고 conda update 를 돌리고 jupyter를 설치한 건데 확실하진 않다. scari@sylvanas:~/codes$ python --version Python 3.4.3 :: Anaconda 2.1.0 (x86_64) scari@sylvanas:~/codes$ pip --version pip 6.0.8 from /Users/scari/anaconda3/lib/python3.4/site-packages (python 3.4) scari@sylvanas:~/codes$ pip install konlpy Exception: Traceback (most recent call last): File "/Users/scari/anaconda3/lib/python3.4/site-packages/pip/basecommand.py", line 232, in main status = self.run(options, args) File "/Users/scari/anaconda3/lib/python3.4/site-packages/pip/commands/install.py", line 339, in run requirement_set.prepare_files(finder) File "/Users/scari/anaconda3/lib/python3.4/site-packages/pip/req/req_set.py", line 229, in prepare_files req_to_install.check_if_exists() File "/Users/scari/anaconda3/lib/python3.4/site-packages/pip/req/req_install.py", line 931, in check_if_exists

Building OpenCV 3.0 Beta on Mac OS X Yosemite with Anaconda / Python3

Python3로 넘어가기로 마음먹은지 몇 달이 지나지 않았을 때쯤, PyCon JP에서 어느 발표 를 보고 문득 OpenCV를 써보고 싶은 생각이 들었다. Python3에서 쓰려면 OpenCV 3.0을 써야했고, 그 때는 아직 정식 패키지가 나오지도 않은 Alpha 버전이었다. 인간 빌드머신인 사수님께 비할바는 아니지만 나도 빌드밥은 조금 먹어봤고 소프트웨어를 빌드해서 쓰는데 별로 거부감이 없었으므로 쉽게 생각하고 빌드를 했는데... 안됨 ㅠㅠ 왜죠? SO에 질문도 올려보고, http://stackoverflow.com/questions/26815537/opencv-3-0-0-alpha-with-python-3-failed-to-import-cv2 "살짝 힘들었는데, 결국은 성공함ㅋㅋㅋ" 라고 읽혀-_-지는 성공기에 댓글도 쭈삣쭈삣 달아보고, http://luigolas.com/blog/2014/09/15/install-opencv3-with-python-3-mac-osx/ 어쨌든, No Luck. 안됨. 빌드는 제대로 된거 같은데 import를 하면 난리남. 같은 증상을 호소하는 애들도 나타나고, 괜한 영웅심이 발동해서 멋지게 이 난제;를 해결하고 보란듯이 SO에 self answer를 달고 싶었으나 능력 부족으로 일단 홀드. piku 작업을 하고 있을때라서 시간을 더 들이기 아까웠다. (...하지만 몇 일뒤 Beta 버전이 나오는데, 모르고 지나침) 일도 바쁘고, OpenCV는 잊혀져가고, 그러다 어떤 친구가 Disqus에 답글도 달고 SO에 답변도 달아주면서 관심을 다시 환기시키는 계기가 되었는데, 이 때는 정신이 없어서 "어 그래? 고생했구나" 하는 느낌으로 Accept. 그러다가 오늘 다시 생각이 나서 찾아보니 OpenCV는 내가 그 삽질을 하고 몇 일 뒤에 Beta를 내놨고, 그 친구의 답변덕분에 무려 4개월만에 OpenCV를 써보게 되었다! ㅠㅠ 저렇게 단순한 문제를 못 찾아내서 넉