많이 쓰이는 단어

구글 검색엔진은 주제에 적합한 페이지에 높은 랭킹을 주고 있습니다. 주제에 적합한 페이지란 주제와 관련있는 단어가 적절하게 사용되었을 뿐 아니라 관련 웹사이트들의 링크가 충분히 있는 페이지일 것입니다.

트윈워드는 언어처리 기반 기술을 이용하여 검색엔진최적화 키워드 리서치 툴을 출시한 바 있습니다. 관련어는 구글 검색엔진에서 주제를 파악하는데도 활용되고 타겟 고객이 사용하는 키워드를 찾아내는 데도 사용되기에 점점 그 중요성이 높아지고 있습니다.

관련어란 주제나 범위, 용례 등으로 연결이 가능한 단어인데요, school 과 teacher, luggage 와 baggage, cat 과 dog 와 같은 예가 있습니다.

이 블로그 포스트에서는 비즈니스와 관련없이 영문 콘텐츠에서 관련어로 많이 쓰이는 단어의 특징을 살펴봅니다. 사람으로 비유하자면 친구가 많은 사람이라고나 할까요? 마치 페이스북에서 친구가 많거나 트위터에서 팔로우가 많은 것처럼요.

그런데 단어는 페이스북 팬수나 트위터 팔로우 수가 없으니 어떻게 친구가 많은지(?) 알 수 있을까요? 빅데이터분석을 이용하여 영미문화권에서 사용하는 영어 문장을 분석하여 어떤 단어가 어떤 단어와 자주 쓰이는지 통계를 뽑아보았습니다. 예를 들어 A dog is fighting with the cat. 이라는 문장에서 dog 와 cat, fight 와 함께 쓰였다고 통계 분석을 합니다.

이런 과정을 거쳐서 특히 많은 단어와 관련이 많은 영어 단어 10개를 뽑아보았습니다.

most-used-words

위 10개를 보면 우리 삶에 꼭 필요한 water, food, money 그리고 자연과 관련이 많은 animal, tree, plant 등이 포함되었구요, disease, old 와 같은 늙거나 병드는 문제, music, sound 와 같은 놀거나 의사전달에 관련한 단어들이 뽑혔습니다.

결국 언어는 우리들의 평소 생활을 반영하고 있다고 봅니다. 우리가 검색엔진최적화를 진행할 때도 이런 관련어의 특징을 이해하고, 이를 잘 활용하는 방향이 바람직할 것입니다.

답글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.