통계와 빅데이터의 차이
조언 : 봉지라면, 컵라면 구분(취향 선택할 때)
- 자연어 입력하고 유의미한 데이터 뽑아내서 추천..?
- 텍스트 기반(contents based) 추천
- 유저 rating table
- 유저가 평가하는 정보를 기반
- 식품의 명, 제조사, 칼로리, 기타 등등
- item 과 유저에 대한 정보.....
사용자 데이터가 없는 상황인데 어떤 알고리즘이 좋을지..?
- 추천에서 평가를 하는 방법은 되게 자의적
- 목적이 명확해야 한다
- 데이터가 있다면
- rating matrix가 만들 데이터가 없다면 서치 필터링
- rule engine??
- 사용자가 카테고리를 설정하면 이에 맞는 카테고리의 item을 사용자에게 보여준다
- 전통적인 콜라보레이터 필터링을 많이 쓴다
로그를 어떻게 사용할 것인가??
- rule engine를 만든다
- 사용자의 추천의 어디에 영향을 줄지 판다
- pare data 파악..?
- 로그데이터가 추천과 어떤 인과관계가 있는지 파악
전문가님 생각
통계 vs 빅데이터