Vấn đề trong ngôi nhà Google

Bài viết được dịch từ blog Coding Horror

Bạn hãy nhìn biểu đồ lượng traffic đổ về trang web stackoverflow.com của chúng tôi trong năm 2010.

Google còn là tay chơi lớn nhất trên thế giới internet trong bao lâu nữa?Google còn là tay chơi lớn nhất trên thế giới internet trong bao lâu nữa?


Khi mà 88.2% trong tất cả lượng traffic đổ về trang web của bạn đến từ chỉ một nguồn riêng lẻ, hãy chỉ trích rằng một nguồn như vậy thì cảm thấy rất … rủi ro. Và có lẽ có một chút gì đó đê tiện, giống như là việc người ta cho quà bạn mà bạn còn chê ỏng chê eo, hoặc nói một điều gì đó công khai làm giảm uy tín đối tác kinh doanh của bạn vậy.

Hơn nữa, hãy nhìn vào thống kê ở trên, thật khó để tránh được việc đưa ra những kết luận hiển nhiên. Tôi đã nói rất nhiều lần rằng Google không phải là một kẻ độc quyền, nhưng dường như họ là tay chơi duy nhất trên internet vậy. Bạn hoàn toàn tự do chuyển sang bất kỳ một bộ máy tìm kiếm “không có khả năng tồn tại” nào khác để thay thế nếu muốn vào bất cứ lúc nào. Chỉ để thở một chút dưới không khí tự do, các bạn ạ.

Bên cạnh lời mỉa mai, thì tôi cũng đặc biệt ngưỡng mộ Google. Mục tiêu công ty của tôi không phải là để được Google mua lại, bởi vì tôi sẽ còn một hành trình dài phía trước – nhưng nếu tôi phải lựa chọn một đối tác để bán lại công ty của mình, thì nó sẽ có thể là Google. Tôi cảm thấy tầm quan trọng và sứ mệnh của họ cũng gần với sứ mệnh của chúng tôi hơn hầu hết những đối tác tiềm năng khác mà tôi có thể nghĩ ra. Dù sao thì chúng tôi cũng đã hoàn toàn hạnh phúc với Google như là một người cha nuôi về lượng traffic từ khi mới bắt đầu. Nhưng vào năm ngoái, một điều gì đó kỳ lạ đã xảy ra: đó là nội dung trên các trang tổng hợp tin đã bắt đầu đều đặn vượt qua chúng tôi trên kết quả tìm kiếm của Google bằng chính nội dung của trang web chúng tôi.

Việc sao chép lại nội dung của chúng tôi không phải là một vấn đề. Trên thực tế, chúng tôi khuyến khích điều đó nữa là đằng khác. Nhưng nó là một sự bất công lớn đối với tài sản chúng tôi sở hữu thông qua nội dung được đóng góp một cách hào phóng của những người chia sẻ nội dung trực tuyến. Bất cứ thứ gì được đăng trên Stack Overflow hoặc bất kỳ trang web nào trong mạng lưới Stack Exchange Network, thì đều thuộc quyền sở hữu của cộng đồng dưới giấy phép Creative Commons cc-by-sa. Chính cộng đồng sở hữu những nội dung mà họ đã đóng góp. Chúng tôi muốn toàn bộ thế giới này dạy lẫn nhau và học được từ những câu hỏi và trả lời đăng lên những trang web của chúng tôi. Tổng hợp, sử dụng lại, chia sẻ – và dạy những người ngang cấp của bạn! Đó chính là sứ mệnh của chúng tôi. Đó là lý do tại sao tôi lại thức dậy mỗi buổi sáng.

“Hướng dẫn người ngang cấp là một trong những cách tốt nhất để phát triển sự tinh thông của bạn.” ~ Jeff Atwood

Tuy nhiên, ẩn trong chiến lược này là sự thừa nhận rằng chúng tôi, là chủ thể của những câu hỏi và trả lời gốc đó thì luôn phải được xếp hạng trên cùng. Bạn hãy để ý Wikipedia – lần gần đây nhất bạn click qua một trang web mà không có gì hơn chỉ là một trang đi copy lại nội dung, những bài viết được lấy lại từ trang Wikipedia và được bao lấy bởi những quảng cáo xanh đỏ? Chưa bao giờ, đúng không nào? Nhưng đó là trong lý thuyết về một mô hình kinh doanh hoàn hảo. Đó là lý do tại sao Joel Spolsky và tôi đã tự tin chia sẻ nội dung tới cộng đồng mà hầu như không có giới hạn – bởi vì Google sẽ trừng trị thích đáng những trang web nào mà cố tình chơi tiểu xảo để thu được những lợi nhuận bất chính bằng những nội dung xào nấu lại từ nơi khác. Việc tổng hợp và sử dụng lại là điều tốt, nhưng việc copy với số lượng lớn một cách rẻ tiền và bao lấy nội dung bằng những quảng cáo… thì không thể chấp nhận được.

Tôi nghĩ rằng đây chính là chân lý, nhưng nó cũng được viết ra rõ ràng trong cẩm nang hướng dẫn về quản trị nội dung của Google.

Tuy nhiên, một số webmaster tìm cách cải thiện chỉ số ranking trang web của họ và thu hút người xem bằng cách tạo ra nhiều trang có rất nhiều từ nhưng nội dung lại có rất ít hoặc không có chút giá trị nào cả. Google sẽ hành động chống lại những trang web đang cố tăng thứ hạng bằng cách chỉ đưa ra những trang nội dung tào lao rác rưởi hoặc những trang tự động sinh nội dung khác mà không mang lại bất cứ giá trị nào cho độc giả. Một số ví dụ bao gồm:

Những nội dung sao chép. Một số webmaster sử dụng nội dung được lấy từ những trang web khác, những trang uy tín hơn để nhằm mục đích làm tăng dung lượng của trang web với những nội dung ngẫu nhiên và chẳng liên quan. Những nội dung hoàn toàn sao chép, thậm chí từ những nguồn có chất lượng cao, cũng chẳng cung cấp hoặc bổ sung thêm bất cứ giá trị nào tới độc giả của bạn cả. Sẽ có giá trị hơn nếu bạn dành thời gian đó để tạo ra những nội dung gốc và làm cho trang web của bạn trở nên độc đáo. Điều này sẽ giữ cho độc giả của bạn quay trở lại và cũng sẽ cung cấp nhiều kết quả tìm kiếm hữu ích hơn.

Vào năm 2010, hộp thư của tôi đột nhiên đầy ắp với những lời than phiền từ người dùng – những lời than phiền rằng họ đã thực hiện tìm kiếm trên Google theo từ khóa hoàn toàn thích hợp, và kết quả thu được là những trang web nhái lại nội dung của Stack Overflow cùng với rất nhiều quảng cáo bay phấp phới. Thậm chí tệ hơn, trong một số trường hợp, những câu hỏi gốc ở Stack Overflow không thể tìm thấy bất cứ ở đâu trong kết quả tìm kiếm đó! Điều đó đặc biệt kỳ cục bởi vì những điều khoản quy định có yêu cầu phải link trực tiếp trở lại trang web của chúng tôi, là nguồn chính thống của câu hỏi đó. Google đang đánh chỉ số những trang có nội dung sao chép, không thể tránh được việc nhìn thấy rằng các trang sao chép đó có link ngược lại trang gốc. Điều này lên đến cực điểm, khi có một plug-in trong trình duyệt dùng để chuyển hướng tới Stack Overflow từ những trang web vô giá trị. Thật là đáng thất vọng làm sao. Joel và tôi nghĩ rằng điều này không thể xảy ra được. Và tôi cảm thấy giống như là bản thân mình đã có lỗi với tất cả các bạn.

Cái ý tưởng rằng có thể có một điều gì đó sai với Google là không thể tưởng tượng nổi đối với tôi. Google giống như là trọng lực trong môi trường web vậy, một đại lượng không đổi và có mặt ở khắp nơi; việc đổ lỗi cho Google thì cũng giống như là đổ lỗi cho lực trọng trường về sự vụng về của chính tôi vậy. Nó thậm chí không phải là một lựa chọn nữa. Tôi đã bắt đầu bằng quy tắc vàng: nó luôn là lỗi của tôi. Chúng tôi đã tiến hành hàng tấn các hành động tích cực trên webmasters.stackexchange.com để đảm bảo rằng chúng tôi đã không làm bất cứ điều gì quá ngớ ngẩn, và cả “đại ca” Matt Cutts của Google cũng đã tiến hành điều tra theo cách của anh ta về những bằng chứng được tôi gửi qua Twitter để hỏi anh về một số trường hợp mà các trang web sao chép nội dung lại cho kết quả thống trị. Những vấn đề đã được tìm thấy ở cả hai phía, và những thay đổi đã được tiến hành. Mọi thứ đạt được kết quả thành công!

Mặc cho cái giải pháp nửa tích cực đó, tôi vẫn cảm thấy khá bối rối. Nếu những trang web đi sao chép nội dung một cách rẻ tiền như vậy mà lại cho kết quả rất tốt đến nỗi sinh ra rất nhiều traffic ngay sau lưng nội dung của chúng tôi – thì phần còn lại của thế giới web sẽ làm ăn ra sao? Niềm tin vĩnh hằng của tôi vào lực hút trọng trường của Google đã bị lung lay. Thậm chí lung lay dữ dội.

Từ đầu đến cuối suốt quá trình điều tra của mình thì tôi có một chút nghi ngờ rằng chúng tôi đã nhìn thấy những vết nứt nghiêm trọng trong thuật toán tìm kiếm nền tảng của đế chế mà Google đã xây dựng. Nhưng tôi đã tránh viết một bài về nó vì nỗi sợ hãi rằng người ta sẽ cho tôi là thằng cha bất tài gàn dở. Tôi không cảm thấy thoải mái khi chia sẻ quản điểm này một cách rộng rãi, bởi vì chúng tôi có thể đã làm một điều gì đó hiển nhiên sai. Điều mà chúng tôi có khuynh hướng mắc phải thường xuyên. Trọng lực thì không thể bị sai. Chỉ là do chúng tôi vụng về … đúng không bạn?

Tôi không thể không để ý rằng chúng tôi không chỉ là trang web duy nhất gặp phải những vấn đề nghiêm trọng trong kết quả tìm kiếm của Google trong một ít tháng gần đây. Thực ra thì những hồi chuông cảnh báo về sự giảm sút chất lượng tìm kiếm của Google đã đặc biệt đinh tai nhức óc vào thời gian gần đây:

Trong trải nghiệm cá nhân, các kết quả tìm kiếm của tôi cũng đã cho kết quả rất tồi vào thời gian gần đây. Như một phần cho hoạt động mua sắm vào dịp lễ Giáng Sinh cho bà xã, tôi đã tìm kiếm cụm từ “iPhone 4 case” trên Google. Tôi đã phải bỏ đi hoàn toàn kết quả hai trang tìm kiếm đầu tiên bởi nó hoàn toàn vô nghĩa, và tôi phải lên trang Amazon để tìm kiếm trực tiếp.

Tôi tôn trọng ý kiến ​​của tất cả những người có cùng một suy nghĩ giống nhau rằng — Google, trước kia là một công cụ thiết yếu, thì đang bằng cách nào đó đánh mất giá trị của nó. Những tay spammers, scrapers, and SEO về nội dung sao chép đang thắng thế.

Cũng giống như bất kỳ con người đúng đắn nào, tôi thì đang tích cực ủng hộ Google trong trận chiến này, và Google nên tinh chỉnh một chút thuật toán của họ để cải thiện những điều đã đề cập trong bài viết này. Hơn nữa, đây là lần đầu tiên kể từ năm 2000 mà tôi có thể nhớ rằng chất lượng tìm kiếm của Google bị xuống dốc, và nó đã truyền cảm hứng về một số suy nghĩ hơi dị giáo trong tôi — liệu có phải chúng ta đang nhìn thấy những tín hiệu đầu tiên rằng thuật toán tìm kiếm đã bị thất bại trong chiến lược của nó? Liệu có phải thế hệ kế tiếp của công cụ tìm kiếm sẽ hướng đến trở nên ít quan tâm về mặt thuật toán và quan tâm nhiều hơn về mặt xã hội?

Đó là một điều đáng kinh hãi thậm chí chỉ nói ra để cho vui, nhưng có thể trọng lực đã thực sự bị suy yếu?

Các bài viết liên quan:

Về tác giả bài viết:

Jeff_atwood_coding_horrorJeff Atwood là một chuyên gia công nghệ tại Mỹ, hiện đang sinh sống và làm việc tại Berkeley, CA. Anh là một kỹ sư phần mềm chuyên về công nghệ Microsoft .NET, và là một blogger nổi tiếng trong cộng đồng công nghệ với blog Coding Horror, anh là người sáng lập và kiêm Giám đốc điều hành (CEO) của trang web hỏi đáp uy tín Stack Overflow và cũng là đồng sáng lập của Stack ExchangeDiscourse.

4 comments on “Vấn đề trong ngôi nhà Google

  1. Bài viết này chủ yếu nói về cỗ máy tìm kiếm của Google (còn về đế chế hay hệ sinh thái Google thì câu chuyện lớn hơn). Bức xúc của tác giả là bức xúc của một người chủ kho nội dung và tác giả cũng nhận ra vấn đề vi phạm bản quyền nội dung khó có thể chỉ thay đổi thuật toán tìm kiếm là xong mà còn nằm ở khía cạnh xã hội (PR, tẩy chay, đấu tranh pháp lý). Còn với người dùng cuối chắc chắn nhiều người đã từng thử qua Wolfram, Bing, Wada gì đó… nhưng cuối cùng vẫn quay về cỗ máy Google vì dù chưa hoàn hảo nhưng hiện nay nó vẫn trả về kết quả tốt nhất.

    Hơn nữa, bất cứ công nghệ nào cũng phải dựa trên một bộ lõi và phải có quá trình trưởng thành. Một cỗ máy mới dựa trên công nghệ 1 năm tuổi chưa chắc sánh được cỗ máy dựa trên công nghệ cũ nhưng đã trưởng thành ổn định hơn 10 năm tuổi. Lấy ví dụ HTML5, hồi 2010 nó gây ồn ào nghẹt thở, báo chí tốn rất nhiều mực. Đến cuối 2012, đầu 2013 khi Facebook và một loạt các công ty game lớn đánh giá lại về độ sẵn sàng và sự trưởng thành của HTML5, tuyên bố tạm thời từ bỏ thì HTML5 mới bớt nóng. Các web game hay nhất tiếp tục được làm bằng Flash và Unity Web. Các công ty như LG hăm hở chạy theo trào lưu bỏ Flash trên trình duyệt cuối cùng phải hạ giá bán thê thảm vì các TV trình duyệt đủ Flash vẫn được ưa chuộng hơn, hàng trăm web xem phim không chịu chuyển qua HTML5 (vì cuộc chiến video codec không có hồi kết, sự phân mảnh trình duyệt khiến họ thêm tốn kém trong khi dùng Flash họ có thể đáp ứng hầu hết tất cả các loại trình duyệt, tất cả các hệ điều hành phổ biến, mọi thiết bị dù mới hay cũ, hiệu năng và chất lượng hình ảnh tương đương).

    Như vậy có thể đoán cỗ máy tìm kiếm Google sẽ còn giữ vị trí quan trọng lâu dài. Bàn về sự suy tàn của cỗ máy tìm kiếm nói riêng hay sự sụp đổ cả công ty Google nói chung, trước hết thử tìm hiểu những yếu tố thường gây ra sự kết thúc cho một đế chế trong lịch sử:

    1. Phát triển gượng ép, trái quy luật tự nhiên
    2. Một mình một khu rừng, thiếu đa dạng sinh học
    3. Không chấp nhận cạnh tranh bình đẳng để tiến bộ
    4. Thiếu sức đề kháng, mục rỗng từ bên trong
    5. Tham lam, chủ quan, ngạo mạn

    Ta thấy Google có vẻ không (hoặc chưa) có dấu hiệu mắc phải những sai lầm này. Cởi mở là văn hóa nằm trong gen di truyền của công ty, giống như bộ gen sinh học trong tự nhiên. Sự cởi mở giúp Google thay đổi, thích nghi, đào thải và chọn lọc. Không những họ đề cao tự do sáng tạo, chấp nhận cạnh tranh sòng phẳng với các đối thủ bên ngoài mà ngay trong công ty họ cũng luôn có các cặp 2 bộ phận cạnh tranh với nhau. Họ xây dựng hệ sinh thái mở, luôn chấp nhận hưởng lợi sau người khác. Họ khá dân chủ, hình ảnh của chủ tịch hay CEO khá mờ nhạt và có thể được thay đổi bất cứ lúc nào trước khi người khác kịp nhận ra. Tất cả những điều đó giúp Google có sức đề kháng cao, luôn tươi mới như một công ty trẻ. Trái lại, Facebook được cho là một công ty khắc nghiệt, khá độc tài, không có nhiều đổi mới sáng tạo, sự phát triển phụ thuộc quá lớn vào chính sách tuyên truyền dựa trên hình ảnh và sức cuốn hút của “lãnh tụ”.

    Các đế chế thường suy tàn khi lãnh tụ không còn hoặc hết hấp dẫn. Đó cũng là sự khác biệt giữa các đế chế cổ đại và “đế quốc Mỹ”. Các đảng phái chính trị ở Mỹ không những cạnh tranh bình đẳng với nhau mà trong nội bộ mỗi đảng sự cạnh tranh cũng rất cao. Nó đảm bảo chỉ những người ưu tú, trong sạch, xuất sắc nhất mới được chọn. Nhưng họ hiểu không có sự xuất sắc nào là mãi mãi. Khi một cá nhân hay một đảng trở nên trì trệ, sa đọa thì dân chúng cả nước lại có cơ hội chọn người tốt hơn thay thế. Như vậy sự suy tàn chỉ ảnh hưởng đến một người hoặc một nhóm người mà không ảnh hưởng hay gây sụp đổ toàn xã hội. Mô hình này giúp quốc gia trường tồn vì nó hoàn toàn trở về với tự nhiên, tuân theo quy luật tự nhiên. Tác giả Fukuyama đã viết cuốn sách The end of history ý nói nhân loại đã hiện thực hóa được mô hình quản trị xã hội phù hợp nhất, sẽ không còn phải vật lộn triền miên với đường hình sin ác nghiệt kia nữa. Cố thủ tướng Anh Winston Churchill cũng có câu nói nổi tiếng đại ý: Dân chủ là mô hình tồi, nhưng các mô hình khác còn tồi hơn.

    Tuy vậy, cũng phải thừa nhận rằng không phải muốn là áp dụng được ngay. Mấy ngàn năm trước người Hy Lạp đã biết về dân chủ, cộng hòa nhưng vẫn phải trải qua đêm dài phong kiến, chỉ đến thời đại công nghiệp thế kỷ 18 nước Mỹ mới là nước tiên phong áp dụng thành công và một vài mô hình dân chủ được nhân loại dần hoàn thiện như ngày nay. Rõ ràng khoa học kỹ thuật, nhất là kỹ thuật thông tin chính là đòn bẩy thúc đẩy mọi tiến bộ xã hội và làm thay đổi các thể chế chính trị vì thông tin giúp phát triển kinh tế, khai sáng tri thức, truyền tải sự thật và gắn kết xã hội. Người làm CNTT có quyền tự hào về điều này.

    Chúc mừng năm mới Ất Mùi tới các đồng nghiệp.

    • Cảm ơn một bình luận rất hay nữa của Alan. Qua đó mình cũng học hỏi và biết thêm được nhiều điều.

      Chúc Alan và các bạn độc giả sang năm mới Ất Mùi đạt được nhiều thành công! 🙂

  2. Xin lỗi m.ng, mình làm phiền chút, mình muốn mua 1 cuốn Code complete nhưng search ko ra (mình muốn mua sách giấy), mà mua online thì hơi max :(( nên muốn hỏi m.ng ko biết có địa chỉ nào giúp mình mua sách cũ hoặc photo đều được, mình cám ơn (mình ở HN)

Gửi phản hồi

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s