top of page

한국어 소셜 데이터 속 바이럴 마케팅 분류



팀명

  구팀

팀원 명단

  구재빈, 손중영, 한원희

지도교수

  장경선교수님

작품 배경 및 목적

  최근 SNS와 소셜 미디어의 발달로 대상 데이터가 급증함에 따라, 소셜 마케팅과 더불어 소셜 데이터 관련 산업들이 최근 사이에 그 수요가 급증하고 있다.

그러나 SNS의 너무도 방대한 데이터와 신뢰성이 떨어지는 데이터들, 특히 그중에서도 바이럴 마케팅 데이터로 인해 CLO(소셜 데이터 분석가)들은 현재 많은 어려움을 겪고 있다고 한다.

본 프로젝트는 이러한 바이럴 마케팅 데이터로인해 어려움을 겪고 있는 CLO와 관련산업 종사자들을 찾아가 그 어려움에 대해 공감하고, 이를 컴퓨터 공학적 방법을 통해 해결해 줄 수 있는 결과물을 만들고자 시작하였다.

작품 내용

  개발하고자 하는 내용은 크게 4가지로 분류할 수 있다.

첫째로 웹 크롤러이다. 본 프로젝트에서 제공하는 웹 크롤러는 이용자를 대신하여 특정 주제 및 검색어에 대하여 실시간으로 데이터를 수집하는 시스템이다. 웹 크롤러가 수집하는 데이터로는 url, 제목, 내용, 이미지가 있으며 수집한 데이터는 csv파일로 저장된다.

두번째로는 내용 데이터 분석 모듈이다. 내용 데이터 분석 모듈은 웹 크롤러가 수집한 데이터에서 내용 데이터를 대상으로 바이럴 마케팅 여부를 조사하는 시스템이다. 조사하는 방법으로는 TDM, Co-occurrence matrix, BoW와 같은 방법론이 사용되었으며, 고료 표기, 과도한 업체 정보의 노출, 필요 이상의 업체 소개(문장의 어색한 사용), 다른 데이터와의 본문 유사도를 확인한다. 이후, 얻어낸 결과를 정규화하고 k-means알고리즘을 통해 3개의 군집으로 군집화 한다. 각 군집은 바이럴 데이터 정도의 수준을 의미한다.

세번째로는 종합 분석 모듈이다. 종합 분석 모듈은 내용 데이터 분석 모듈의 결과와 이미지 데이터를 기준으로 바이럴 마케팅 여부를 조사하고 통합하는 시스템이다. 일반적으로 바이럴 데이터에서 고료에 대한 표기는 ‘공정위 문구’라는 이미지의 형태로 표기되는데 이미지 데이터에서 내용 데이터에서 찾아내지 못한 고료 표기를 찾아내고 이를 내용 데이터 분석 모듈의 결과와 함께 다양한 머신러닝 기법을 통해 분석한다.

마지막으로 사용자 인터페이스다. 사용자 인터페이스에서는 최종 분석 결과를 확인할 수 있으며 이를 필요에 맞게 분류할 수 있다.

 








조회수 73회댓글 0개

최근 게시물

전체 보기
bottom of page