[2024/05] 구글 SEO 알고리즘 유출 사태 정리

2024/05 구글 상위 노출(SEO) 
알고리즘 유출 사태 정리

24년도에 구글에서 내부 직원이 구글 SEO에 관련된 문서를 유출시킨 사건이 발생했습니다. 구글이 기존에 중요하다고 이야기하던 요소들과 상충되는 요소들을 통해 검색 순위를 결정한다는 것이 밝혀져 큰 파장이 일었었죠.

이 사건이 어떻게 진행되었었는지, 유출된 문서의 내용은 무엇인지, 문서에서 중요하게 봐야하는 것은 무엇인지 간단하게 정리해드리겠습니다.

 

구글 SEO
알고리즘 유출 사태

2024년 3월 13일 구글 내부 문서가 깃허브에 게시되었습니다. 이름은 Content API Warehouse 이고, 자동화 봇(yoshi-code-bot)이 올린 문서입니다.

2024/05 구글 상위 노출(SEO) 알고리즘 유출 사태 정리
2024/05 구글 상위 노출(SEO) 알고리즘 유출 사태 정리

중요한 것은 이 문서에 구글의 검색 알고리즘에 대한 정보들이 다수 포함되어 있었다는 것입니다. 이 문서에는 2,596개의 모듈과 14,014개의 속성들이 들어있었습니다. 이 모듈과 속성들이 대부분 검색 순위를 결정하는 것에 사용되는 것들이었기 때문에 문서를 분석하면 대략적인 검색 순위 로직을 알 수 있게 되었습니다.

 

구글에서는 초기에는 공식적인 언급을 기피했습니다. 그러나 이후에 실제로 구글의 내부 문서였다는 것을 시인했죠. 다만 해당 정보가 오래된 정보이고, 현재는 적용되지 않을 수 있다는 것을 명시했습니다. 

 

그러니 공식적인 구글에서 사용했던 문서인 것은 분명합니다. 하지만 해당 요소들이 현재까지 쓰이고 있는 요소인지는 불확실하고, 요소마다의 반영 비율등의 세부적인 데이터는 없기 때문에 어디까지나 구글 알고리즘을 파악하는 참고용으로 사용하는 것이 좋아보입니다.


유출된 구글 SEO 알고리즘 요약

유출된 내용 중에서 중요한 내용이나, 구글이 기존에 중요하지 않다고 주장 했는데, 사실은 중요했던 요소들에 대해서 요약해 말씀드리겠습니다.

1. 클릭 데이터의 중요성

구글은 예전부터 클릭 데이터를 검색 순위에 반영하기 않는다고 말해왔습니다. 하지만 유출된 문서에서는 클릭데이터를 순위를 결정하는 요소에서 중요하게 다루고 있는 것을 볼 수 있었습니다.

 

클릭 데이터는 검색 결과에서 얼마나 많은 '클릭률'이 나오는지를 의미하는 것입니다. 이 요소를 통해서 사람들이 클릭할만한 제목을 작성하는 것이 더 중요해 졌습니다.

2. 도메인 권위 (Domain Authority)

구글은 도메인 권위를 사용하지 않는다고 여러 차례 밝혔습니다. 그러나 문서에는 'siteAuthority'라는 항목이 포함되어 있었습니다. 

도메인 점수(Domain Authority)가 구글 검색 순위 상승에 좋은 영향을 미칠 것으로 보입니다. 홈페이지를 운영하면서 도메인 점수 상승을 시키는 것은 검색 순위에 추가적으로 도움이 될 것으로 보입니다.

3. 크롬 데이터의 사용

구글은 크롬 브라우저 데이터를 검색 순위에 사용하지 않는다고 주장해왔습니다. 그러나 유출된 문서에는 크롬 데이터를 포함한 여러 측정 항목이 포함되어 있습니다.

크롬을 이용한 사용자들의 데이터들이 중요해진 것으로 보입니다. 하지만 크롬 사용자들을 위한 특별 조치등을 할 수 없기 때문에 홈페이지 운영에는 별로 중요한 정보는 아닌 것으로 보입니다.

4. 신생 웹사이트 샌드박스

구글에서는 신생 웹사이트의 샌드박스 기간이 없다고 주장해 왔습니다. 하지만 문서에는 'hostAge'라는 속성이 포함되어 있었습니다. 이 요소를 보고 알 수 있는 것은 웹사이트가 오래된 정도를 검색 결과에 반영한다는 것입니다. 다르게 말하면 새롭게 만들어진 홈페이지는 구글 검색에서 안 좋은 영향을 받을 수 있다는 말도 됩니다.

구글에서 상위 노출을 하려면, 장기적으로 홈페이지를 운영하는 것이 중요해졌습니다.

5. 사용자 경험 (UX)

구글은 사용자 경험이 검색 순위에 큰 영향을 미치지 않는다고 주장해왔습니다. 그러나 문서에는 클릭률(CTR) 체류 시간(dwell time)과 같은 지표가 실제로 순위에 영향을 미친다는 내용이 포함되어 있습니다.

이 클릭률과 체류 시간은 홈페이지 내부에서 일어나는 일들을 말합니다. 홈페이지에 들어온 방문자가 다른 글을 클릭하는 횟수가 많고, 체류를 오래할수록 검색 결과에서 더 상위 노출을 하게 된다는 것을 의미합니다. 내부 클릭률은 애널리틱스 참여율로 확인하시면 좋을 것으로 보입니다.

결국 좋은 콘텐츠를 작성하는 것이 더 중요해 졌습니다.

6. 저자 정보의 중요성

구글은 저자 정보가 검색 순위에 영향을 미치지 않는다고 밝혔습니다. 그러나 문서에는 구글이 페이지의 저자 데이터를 수집하고 이를 순위 결정에 사용하고 있음을 시사하는 내용이 포함되어 있습니다.

메타 태그의 author 를 기본적으로 갖추고 있는 것이 중요해졌습니다.

(author 넣는 방법은 추후에 알려드리겠습니다.)

7. 콘텐츠 최신성

문서에는 구글이 콘텐츠의 최신성을 중요하게 여긴다는 내용이 포함되어 있습니다. 이는 구글이 콘텐츠의 최신성을 평가하고 이를 순위 결정에 반영한다는 것을 의미합니다. 

콘텐츠가 신선할수록 구글에서는 상위 노출을 할 수 있게 됩니다. 구글 SEO 요소 가이드를 보시면, Freshness 점수는 1년을 기준으로 최신화가 필요하다는 것을 알 수 있습니다. 콘텐츠를 새롭게 만드는 것이 좋고, 만약에 1년이 넘어간 콘텐츠는 내용 보강을 통해 Freshness 점수를 다시 최신화 시켜주시는 것이 중요합니다.

8. 링크의 중요성

링크 빌딩이 여전히 중요한 순위 결정 요소로 남아있다는 내용이 문서에 포함되어 있습니다. 링크의 다양성과 관련성이 중요한 역할을 한다는 점이 강조되었습니다.

구글은 태생적으로 백링크를 통해서 문서의 품질을 계산해 왔습니다. 스탠포드 대학생들이 신뢰도가 높은 논문들은 인용이 잘 된다는 것을 보고, 인용(백링크)가 많이 생기는 문서는 품질이 좋다고 평가하는 검색 엔진을 만들었고, 이것이 구글입니다. 구글을 만들면서 스탠포드에서 제출한 논문까지 확인할 수 있습니다.

백링크 가이드를 살펴보시면, 백링크는 여전히 구글에서 중요한 요소로 작용하고 있는 것을 볼 수 있습니다. 홈페이지를 운영하고 계신다면 품질이 좋은 백링크 작업은 지속적으로 진행해주셔야하겠습니다.

✅ 관련 콘텐츠

'이것' 만 잘 하면, 구글 상위 노출? - SEO 분석 가이드  >

Step by Step, 고품질 백링크 직접 만들기  >

구글 순위 상승에 효과있는, 무료 백링크 받는 방법 >