Nội Soi Google

1. THÔNG TIN SÁCH/EBOOK 

Tác giả : Steven Levy

Download sách Nội Soi Google ebook PDF/PRC/MOBI/EPUB. Tải miễn phí, đọc online trên điện thoại, máy tính, máy tính bảng.

Danh mục : KINH TẾ

2. DOWNLOAD

Định dạng ebook                  

File ebook hiện chưa có hoặc gặp vấn đề bản quyền, Downloadsach sẽ cập nhật link tải ngay khi tìm kiếm được trên Internet.

Bạn có thể Đọc thử hoặc Xem giá bán.

Bạn không tải được sách ? Xem hướng dẫn nhé : Hướng dẫn tải sách

3. GIỚI THIỆU / REVIEW SÁCH

Lời giới thiệu

Mở đầuTÌM KIẾM GOOGLE

“Bạn đã từng nghe nói về Google?”

Năm 2007, vào một ngày tháng Bảy vô cùng nóng nực, tại một làng quê vùng nông thôn Ragihalli của Ấn Độ, cách thành phố Bangalore 30 dặm. 22 người từ một công ty có trụ sở ở Mountain View, California, lái mấy chiếc xe SUV và đi theo một con đường mòn dẫn tới địa bàn của 70 căn lều quân sự xơ xác với sàn đổ bê tông, bao quanh là những cánh đồng thi thoảng lại bị dày xéo bởi lũ voi không mời mà tới. Dù mấy năm gần đây điện đã về đến Ragihalli nhưng trong cộng đồng này không có lấy một chiếc máy tính cá nhân nào. Cuộc viếng thăm đã bắt đầu với chút bối rối của những người khách lạ khi họ bước ra khỏi xe và được chào đón bởi toàn thể dân cư trong làng, lúc này có khoảng 200 người. Cứ như thể là những vị khách phương Tây ăn mặc chỉn chu này vừa đổ bộ từ hành tinh khác, theo một nghĩa nào đó thì quả có thế thật. Bọn học sinh bị đẩy lên trước và trình diễn một bài hát. Đổi lại, chúng được các vị khách tặng sách vở và kẹo. Một khoảng lặng căng thẳng bị phá vỡ khi Marissa Mayer, người dẫn đầu đoàn đại biểu, một phụ nữ 32 tuổi, nói: “Hãy giao lưu với họ đi.” Nhóm tỏa ra và bắt đầu tham gia vào cuộc đàm đạo đầy lúng túng với dân làng.

Đó là cách Alex Vogenthaler tới hỏi chuyện một thanh niên mảnh khảnh đang cười hớn hở, rằng anh đã nghe đến Google, ông chủ của Vogenthaler bao giờ chưa. Đó là câu hỏi mà Alex không bao giờ phải đặt ra ở quê hương mình: Rõ ràng là tất cả mọi người ở Mỹ và mọi nơi trong thế giới mạng đều biết đến Google. Sản phẩm tìm kiếm trên Internet hiệu quả đến phi thường của nó thay đổi cách con người tiếp cận với thông tin, thay đổi cách người ta nghĩ về thông tin. Lần đầu phát hành cổ phiếu ra công chúng (IPO) của nó vào năm 2004 đã biến nó thành một gã khổng lồ kinh tế. Và những người sáng lập ra nó chính là ví dụ hoàn hảo của những bộ óc kỹ thuật cực kỳ thông minh, đại diện cho tương lai của ngành kinh doanh trong kỷ nguyên Internet.

Anh trai làng thú nhận là không, anh chưa bao giờ nghe nói về Google cả. “Nó là cái gì vậy?”, anh hỏi. Vogenthaler cố gắng giải thích bằng cách đơn giản nhất rằng Google là một công ty hoạt động trên Internet. Người ta sử dụng nó để tìm kiếm thông tin. Anh có thể đưa ra cho nó một câu hỏi và nó sẽ ngay lập tức đưa cho anh câu trả lời từ những kho chứa thông tin khổng lồ mà nó thu thập được trên Mạng lưới toàn cầu (World Wide Web).

Người thanh niên kiên nhẫn lắng nghe nhưng rõ ràng là anh này thân thuộc với đồng ruộng hơn là lĩnh vực tìm kiếm.

Rồi chàng thanh niên cầm lên một chiếc điện thoại di động lên ngắm nghía, có vẻ như muốn hỏi: “Ý anh là cái này hả?”.

Tín hiệu kết nối trên màn hình điện thoại hiển thị bốn vạch. Ở Mỹ, có những vùng lãnh thổ mà người ta hiếm khi nhận được sóng – hay thậm chí không thu được vạch sóng nào. Nhưng ở đây, vùng nông thôn Ấn Độ, sóng lại rất khỏe.

Thì ra, Google đang chuẩn bị cho một dự án trị giá nhiều triệu đô la để biến những chiếc điện thoại thông minh thành phụ kiện mang thông tin hỗ trợ cho bộ não của con người, cho phép mọi người ngay lập tức lấy thông tin từ một kho tri thức khổng lồ của thế giới. Người đàn ông này có thể chưa biết đến Google, nhưng công ty này sẽ sớm có mặt tại Ragihalli. Và lúc đó anh sẽ biết đến Google.

Tôi đã chứng kiến cuộc trao đổi này với tư cách là một phóng viên trong chuyến đi hàng năm của các trợ lý giám đốc phụ trách sản phẩm (APM), một nhóm được coi như những người lãnh đạo tương lai của công ty. Chúng tôi bắt đầu hành trình của mình ở San Fransico sau đó hạ cánh xuống Tokyo, Bắc Kinh, Bangalore và Tel Aviv trước khi trở về nhà sau

16 ngày.

Sự tham gia của tôi chuyến đi là kết quả của một mối quan hệ lâu dài với Google. Cuối năm 1998, tôi đã nghe đồn nhiều về một công cụ tìm kiếm thông minh hơn và đã dùng thử. Google tốt hơn hẳn tất cả những công cụ tôi đã từng sử dụng trước đó. Khi được nghe một chút về phương pháp mà công cụ này sử dụng để mang lại kết quả tốt đến vậy – nó dựa trên sự dân chủ trên nền tảng web – tôi lại càng thấy trí tò mò của mình bị kích thích. Đây là cách tôi đề cập đến nó trên tờ Newsweek phát hành ngày 22 tháng 2 năm 1999: “Google, công cụ tìm kiếm “nóng” nhất trên mạng (Net), tự sàng lọc các phản hồi trên web1 để đem đến những kết quả sát hơn với yêu cầu của khách hàng.”

Cũng trong năm đó, tôi thu xếp với Cindy McCaffrey, giám đốc Truyền thông doanh nghiệp mới của Google, để tới thăm trụ sở công ty ở Mountain View. Tôi đã tới thăm rất nhiều công ty mới khởi nghiệp nên không quá ngạc nhiên với sự lộn xộn ấm cúng – một căn phòng rộng với những khoang nhỏ vẫn còn để trống và một đống bóng tập thể dục. Dù vậy, tôi đã không ngờ là thay vì vận những chiếc áo phông và quần jean truyền thống, đám nhân viên lại diện toàn đồ hóa trang. Tôi đã tới đúng vào lễ Halloween.

“Steven, đây là Larry Page và Sergey Brin, Cindy nói, giới thiệu tôi với hai anh chàng trẻ tuổi, những người vừa thành lập công ty với tư cách là hoọc iện cao học của đại học Stanford. Larry ăn mặc như một tên cướp biển với một cái áo khoác lông thú và chiếc mũ có mấy cái sừng thò ra. Sergey mặc bộ đồ hình con bò. Trên ngực cậu là một tấm cao su, từ đó nhô ra mấy cái núm vú to đùng, đầy chấm nhỏ. Họ chào đón tôi rất vui vẻ và chúng tôi rút vào phòng họp, nơi Cướp biển và Bò giải thích sức mạnh kỳ diệu của công nghệ PageRank (xếp thứ hạng trang) của Google.

Đó là buổi phỏng vấn đầu tiên trong rất nhiều cuộc phỏng vấn tôi thực hiện tại Google. Trong vài năm sau đó, công ty đã trở thành tâm điểm cho những báo cáo của tôi về công nghệ trên tờ Newsweek. Từ một công ty có xuất phát điểm nhỏ bé Google đã nhanh chóng trở thành một đế chế với hơn 20.000 nhân công. Mỗi ngày, hàng tỉ người sử dụng công cụ tìm kiếm của nó, và khả năng đáng kinh ngạc của Google trong việc mang lại những kết quả tìm kiếm trong vòng vài phần nghìn giây đã thay đổi cách thức cả thế giới thu thập thông tin. Số lượng người nhấp chuột vào các thanh quảng cáo đã mang lại cho Google lợi nhuận lớn và biến những người sáng lập thành tỉ phú – đồng thời cũng châm ngòi cho những tiếng la ó phản đối từ phía nhóm người hưởng lợi từ quảng cáo truyền thống

Google cũng trở nên nổi tiếng với văn hóa không phân biệt thứ bậc và cách thức đưa ra quyết định kinh doanh căn cứ trên số liệu; các chuyên gia quản trị xôn xao bàn bán về những phương pháp khác thường của nó. Năm tháng trôi qua, Google bắt đầu thể hiện sứ mệnh của mình – thu thập và khiến cho thông tin của thế giới trở nên dễ tiếp cận và hữu dụng – theo nghĩa rộng nhất có thể. Công ty tạo ra một loạt các ứng dụng trên nền tảng web đồng thời công bố ý định tạo phiên bản điện tử cho toàn bộ sách trên thế giới. Nó bắt đầu thâm nhập vào lĩnh vực hình ảnh vệ tinh, điện thoại di động, sản xuất năng lượng, lưu ảnh. Rõ ràng, Google là một trong những đóng góp quan trọng nhất cho cuộc cách mạng của máy tính và công nghệ, cuộc cách mạng đã đánh dấu một bước ngoặt trong nền văn minh. Tôi đã từng muốn viết một cuốn sách về công ty này nhưng chưa biết viết thế nào.

Rồi vào đầu tháng 7 năm 2007, tôi được đề nghị tham gia cùng đoàn trợ lý giám đốc phụ trách sản phẩm trong chuyến đi của họ. Đó là một lời mời chưa từng có từ một công ty vốn thường hạn chế liên hệ giữa báo chí với nhân viên của mình. Tôi được biết rằng, chương trình APM là một sáng kiến rất có giá trị. Đây là trích dẫn một đoạn quảng bá mà một trong số các thành viên đã nói với những sinh viên vừa tốt nghiệp và sắp ra trường: “Chúng tôi đầu tư vào các APM của mình nhiều hơn bất cứ công ty nào từng đầu tư vào nhân viên trẻ của họ… Chúng tôi hình dung một thế giới nơi mọi người đều nghiêng mình kính nể trước sự thật rằng những nhà lãnh đạo của Google, những CEO giỏi nhất ở thung lũng Silicon, và những bậc lãnh đạo được tôn trọng nhất trong các tổ chức phi chính phủ toàn cầu đều trưởng thành từ chương trình APM của Google.” Eric Schmidt, CEO của Google nói với tôi: “Một trong những người này một ngày nào đó rất có thể sẽ là CEO của chúng tôi – chúng tôi chỉ chưa biết là người nào thôi.”

Mười tám APM trong chuyến đi đã từng làm việc trong tất cả các bộ phận của Google: Nghiên cứu, quảng cáo, ứng dụng và thậm chí là cả những dự án ngầm, ví dụ như nỗ lực của Google để có được quyền đăng tải các tạp chí trên danh mục của mình. Nhóm của Mayer, cùng với các APM, đã lập ra một kế hoạch của chuyến đi. Mỗi hoạt động đều có một mục đích ngầm định nhằm nâng cao hiểu biết về vấn đề công nghệ hay kinh doanh, hoặc khiến họ, theo cách nói của công ty, trở nên đậm “chất Google” hơn. Chẳng hạn, ở Tokyo, họ tham gia vào một cuộc săn lùng đồ phế thải ở quận điện tử lừng danh Akihabara của thành phố. Mỗi đội của đoàn APM góp 50 đô la để mua những thiết bị kỳ quặc nhất mà họ có thể lùng được. Ngụp lặn trong những con ngách bầy bán đầy linh kiện điện tử, họ kết thúc với bộ sưu tập vô cùng phong phú: USB có hình gạt tàn đang bốc khói, cái đĩa mô phỏng bề mặt của mặt trăng; máy phân tích hơi thở có thể cài đặt trong ô tô và một chiếc đũa ngắn và mập mà khi vẫy lui vẫy tới sẽ hiện lên các từ bằng đèn LED. Ở Bangalore cũng có một cuộc săn hàng khác – một chuyến du ngoạn tới khu vực chợ, nơi diễn ra cuộc thi tìm người mặc cả giỏi nhất. (Một cách đào tạo tốt cho những vụ mua bán máy tính số lượng lớn hay thậm chí là mua một công ty Internet mới thành lập). Một điểm cao trào nữa ở Tokyo là chuyến đi đến chợ cá Tsukiji lúc năm giờ sáng. Điều hấp dẫn các APM không phải món sushi tươi ngon mà là cơ chế đấu giá cá, theo một cách nào đó thì khá giống với cách Google vận hành chương trình quảng cáo Adwords của mình.

Ở Trung Quốc, các APM được nghe Kai-Fu-Lee, giám đốc phụ trách khu vực, nói về việc cân bằng giữa kiểu làm việc không bị ràng buộc bởi các luật lệ của nhân viên Google với các quy định của Chính phủ – và công tác kiểm duyệt. Tuy nhiên, nhưng trong suốt buổi phỏng vấn với khách hàng Trung Quốc, các APM lại khá mất tinh thần khi nghe cách người dân địa phương nhìn nhận về công ty: “Baidu [đối thủ cạnh tranh tại địa phương của Google] biết nhiều [về Trung Quốc] hơn Google”, một người trẻ tuổi nói với một APM.

Ở mỗi văn phòng mà các APM ghé thăm, họ đều tham gia vào các cuộc họp với nhân viên Google địa phương, đầu tiên là để biết thêm về các dự án đang triển khai và sau đó thuật lại cho họ những việc diễn ra ở trụ sở tại Mountain View. Tôi bắt đầu thấy được cảm giác của người trong cuộc về các quy trình hoạt động của Google – và làm thế nào mà việc phục vụ người dùng của nó lại na ná giống như một cuộc vận động lớn. Đã có một khoảnh khắc thú vị ở Bangalore khi Mayer nhận câu hỏi từ phía những kỹ sư địa phương sau khi trình bày khái quát về một sản phẩm sắp ra đời. Một trong số những kỹ sư này hỏi: “Chúng tôi đã được nghe về đồ thị cho các sản phẩm, thế còn đồ thị cho doanh thu thì sao?”. Cô suýt nữa thì nổi đóa lên với anh kỹ sư. “Đó không phải cách nghĩ,” cô nói, “Chúng ta tập trung vào người dùng. Nếu làm cho họ hạnh phúc, chúng ta sẽ có doanh thu.”

Phần hấp dẫn nhất trong chuyến đi là khoảng thời gian trải nghiệm với những nhân viên Google trẻ tuổi. Họ là những nhân viên ưu tú với điểm thi SAT2 hoàn hảo hoặc gần hoàn hảo. Được lựa chọn cẩn thận từ hàng nghìn người sẵn sàng chết để có được công việc đó, tính cách và khả năng của họ phản ánh tính cách của chính Google. Trên xe buýt đi đến Vạn lý Trường thành của Trung Quốc, một trong số các APM đã thống kê nhân khẩu của nhóm và phát hiện ra rằng hầu hết trong số họ có bố mẹ là giáo sư và trên nửa có bố mẹ đã từng giảng dạy tại trường đại học – cũng giống như những người sáng lập ra Google. Tất cả họ đều lớn lên cùng với Internet và coi các định luật của nó tự nhiên như là nguyên lý vạn vật hấp dẫn. Họ nằm trong số những người thông minh và tham vọng nhất của thế hệ được trang bị tốt hơn thế hệ đi trước trong việc kiểm soát những làn sóng kỹ thuật ồ ạt. Đầu óc họ cộng hưởng mạnh mẽ với các giá trị về tốc độ, tính linh hoạt cũng như thái độ trân trọng số liệu của công ty.

Tuy nhiên, ngay cả khi chìm đắm giữa bong bóng lạc quan của những thanh niên trẻ tuổi này, tôi vẫn có thể nhận thấy trạng thái căng thẳng gắn liền sự phát triển đột phá của Google, từ một công ty non trẻ đầy nhiệt huyết trở thành một gã khổng lồ thống trị thị trường với hơn 20.000 nhân viên. Các APM dành một năm trời để lèo lái con đường truyền thống của một tập đoàn lớn, dù với sự khác biệt hoàn toàn – và giờ đây họ đã gần như trở thành những nhân viên hàng đầu. Thêm một điều nữa, tôi đã rất sửng sốt khi phát hiện ra rằng không một ai trong số những người bạn đồng hàn chủa tôi nghĩ rằng 5 năm nữa mình vẫn làm việc cho Google. Marissa Mayer tiếp nhận tin này một cách bình tĩnh, khẳng định rằng ngay từ đầu, chính tham vọng đó là lý do họ được tuyển dụng. “Đây chính là kiểu gen mà Larry và Sergey tìm kiếm”, cô nói với tôi, “ngay cả nếu họ rời bỏ công việc, điều đó vẫn tốt cho chúng tôi. Họ sẽ mang theo DNA của Google đi cùng với mình”

Sau thời gian gần một thập kỷ theo sát Google , tôi nghĩ rằng mình đã biết về nó khá rõ, nhưng chuyến đi kéo dài hai tuần này đã giúp tôi có được một góc nhìn khác, khiến tôi nhìn nhận, công ty dưới ánh an , rộng lớn hơn. Tuy nhiên, vẫn còn khá nhiều ẩn số. Google là một công ty được xây dựng dựa trên các giá trị của những người an lập an ó, những người có tham vọng xây dựng lên một tập đoàn vững mạnh có ảnh hưởng đến toàn thế giới, đồng thời có cả sự căm ghét thói quan liêu và các ràng buộc phải có khi điều hành một công ty như vậy. Google đề cao sự trong sạch đạo đức thông qua phương châm chính thức của mình: “Đừng là kẻ ác”, nhưng dường như có một “điểm mù” liên quan đến hậu quả mà công nghệ về sự riêng tư và quyền sở hữu của nó đem lại. Nguyên tắc nền tảng của Google là được phục vụ người dùng, nhưng một mục tiêu tạo ra một bộ máy trí tuệ nhân tạo khổng lồ sẽ mang lại hậu quả không mong muốn, ảnh hưởng đến cuộc sống của tất cả chúng ta. Ngay từ đầu, những người sáng lập công ty nói rằng họ muốn thay đổi thế giới. Nhưng họ là ai? Và họ hình dung trật tự thế giới mới sẽ như thế nào?

Sau chuyến đi, tôi nhận ra rằng cách tốt nhất để trả lời những câu hỏi này là viết càng nhiều càng tốt về những điều diễn ra bên trong Google. Cũng như tôi đã có được một cái nhìn hiếm hoi về hoạt động bên trong của công ty trong suốt mùa hè năm 2007, tôi sẽ cố gắng để ngụp lặn sâu hơn vào kỹ thuật, cuộc sống và văn hóa của nó, để viết về cách nó thực sự hoạt động, phát triển các sản phẩm và kiểm soát sự phát triển cũng như hình ảnh của mình trước công chúng. Tôi sẽ là một người ngoài cuộc với góc nhìn của người trong cuộc.

Tất nhiên, để làm điều này, tôi cần sự hợp tác. May mắn thay, dựa trên mối quan hệ lâu dài của chúng tôi, giám đốc điều hành Google, bao gồm “LSE” – Larry Page, Sergey Brin và Eric Schmidt – đã đồng ý để cho tôi tham gia. Trong hai năm tiếp theo – khoảng thời gian nhạy cảm khi vầng hào quang của Google bị mất đôi chút ánh sáng của mình ngay cả khi công ty tăng trưởng mạnh mẽ hơn – tôi đã phỏng vấn hàng trăm nhân viên cũ và mới của Google, đồng thời tham dự một loạt các cuộc họp trong công ty. Chúng bao gồm cuộc họp phát triển sản phẩm, “đánh giá giao diện”, ra mắt sản phẩm tìm kiếm, họp kín, họp TGIF3, và các cuộc họp quan trọng khác về Chiến lược Sản phẩm của Google (GPS), nơi các dự án và sáng kiến được phê duyệt hoặc bị từ chối. Tôi cũng tham gia rất nhiều bữa ăn tại trụ sở của Google.

Tôi đã nhận ra Google là một công ty luôn hứng thú với sự lộn xộn đầy sáng tạo, ngay cả khi sự sáng tạo không phải lúc nào cũng ổn định như mong muốn. Google có các mục tiêu lớn, và các giá trị của toàn bộ công ty đều xuất phát từ những người sáng lập. Mục tiêu của nó là thu thập và sắp xếp thông tin của thế giới – và đó là chỉ là khởi đầu. Ngay từ đầu, những người sáng lập đã coi Google là một phương tiện để hiện thực hóa giấc mơ về trí tuệ nhân tạo trong sự phát triển giá trị nhân loại. Để thực hiện ước mơ của mình, Page và Brin cần phải xây dựng một công ty lớn. Cùng lúc đó, họ lại cố gắng duy trì càng nhiều càng tốt sự tự do linh hoạt, ngang tàng, độc lập của một công ty nhỏ mới thành lập. Trong hai năm nghiên cứu cuốn sách này, sự xung đột giữa những mục tiêu đạt đến đỉnh điểm.

Góc nhìn từ bên trong của tôi cũng cung cấp cho tôi chìa khóa để hé mở nhiều bí mật nằm trong hai “hộp đen” của Google – công cụ tìm kiếm và mô hình quảng cáo của nó – hơn bất cứ một góc nhìn nào trước đó. Phương pháp tìm kiếm của Google là một phần cuộc sống của chúng ta và hệ thống quảng cáo của nó là sản phẩm thương mại quan trọng nhất của thời đại Internet. Trong cuốn sách này, lần đầu tiên độc giả có thể tìm hiểu đầy đủ câu chuyện về phát triển, sự tiến hóa và hoạt động bên trong của công ty. Hiểu biết về những sản phẩm đột phá này giúp chúng ta hiểu về Google và các nhân viên của nó bởi vì hoạt động của họ là hiện thân của cả giá trị và triết lý công nghệ của công ty. Quan trọng hơn, hiểu được những điều đó sẽ giúp chúng ta hiểu thế giới và tương lai của mình.

Nhà văn khoa học viễn tưởng William Gibson đã từng nói rằng tương lai vốn đã ở đây rồi, chỉ không được phân bố đều mà thôi. Ở Google, tương lai đã đang diễn ra rồi. Hiểu về công ty đi tiên phong này và nhân viên của nó cũng là nắm bắt được vận mệnh của công nghệ. Và xin trân trọng giới thiệu, Google: cách thức hoạt động, những suy nghĩ, lý do thay đổi. Google sẽ tiếp tục làm thay đổi chúng ta như thế nào và hy vọng giữ được linh hồn mình ra sao.

ĐỌC THỬ

Phần 1THẾ GIỚI TRONG MẮT GOOGLE

Tiểu sử một công cụ tìm kiếm

1“ĐÓ LÀ TIỂU THUYẾT KHOA HỌC VIỄN TƯỞNG CHỨ KHÔNG PHẢI LÀ KHOA HỌC MÁY TÍNH”

Ngày 18 tháng 2 năm 2010, thẩm phán Denny Chin của tòa án liên bang quận ở phía Nam New York ngồi nghiên cứu đống hồ sơ ngồn ngộn trong Phòng xử án 23B. Đó sẽ là một ngày dài. Ông sẽ chủ trì một phiên điều trần không mang lại gì hơn là những thông tin bổ sung cho hàng trăm đơn đệ trình ông đã nhận được về vụ việc này. “Thật quá sức,” ông nói. Ông lắc đầu, chuẩn bị để nghe những lập luận của 27 đại diện của các nhóm lợi ích hoặc các tập đoàn khác nhau, cũng như phần trình bày của các luật sư cho các bên, những vị luật sư này ngồi kín hai chiếc bàn dài trước mặt ông.

Đó là vụ án Hội các tác giả, Hiệp hội các Nhà xuất bản Mỹ… chống lại Công ty Google. Đó là vụ kiện được dự kiến giải quyết bằng một thỏa thuận hòa giải dân sự, trong đó một nhóm tác giả và nhà xuất bản đưa ra các điều kiện cho một công ty công nghệ để scan và bán sách. Quyết định của thẩm phán Chin sẽ liên quan đến các vấn đề có ảnh hưởng tới tương lai của các sản phẩm kỹ thuật số và một số phát ngôn viên đã nhấn mạnh vào các vấn đề này trước khi phiên tòa diễn ra. Nhưng rất nhiều trong số những người phản đối – và hầu hết những người lên tiếng trong phiên tòa đều phản đối thỏa hiệp này – lại tập trung vào một công ty non trẻ đóng trụ sở tại khuôn viên trường đại học ở Mountain View, California. Đó chính là Google. Các phát ngôn viên có vẻ ngờ vực, e dè, thậm chí xem thường nó.

“Một mối đe dọa lớn với… tự do ngôn luận và sự tham gia vào đa dạng văn hóa”

“Một sự độc quyền phi nghĩa”

“Xâm phạm nghiêm trọng quyền riêng tư”

“Che giấu và đánh lạc hướng”

“Cố định giá… sự bóp méo thị trường nghiêm trọng… dày vò sự tuyệt vọng”

“Hẳn là một hành vi vi phạm luật chống độc quyền”

(Đó là tuyên bố cuối cùng mang ý nghĩa quan trọng, vì nó đến từ trợ lý Chánh văn phòng luật sư Hoa Kỳ)

Nhưng chính quyền liên bang mới chỉ là một trong các đối thủ gây kinh ngạc của Google. Một số khác là những người ủng hộ lợi ích công cộng, giám sát quyền riêng tư và túi tiền của công dân. Những người khác là những người ủng hộ tự do ngôn luận. Thậm chí còn có một người phản đối đại diện cho ca sĩ nhạc đồng quê Arlo Guthrie.

Trớ trêu là bản thân Google lại bị tấn công vì đã coi thường các giá trị thiêng liêng và các chuẩn mức đạo đức cao mà nó rất mực trân quý. Những người sáng lập công ty luôn nói rằng mục tiêu của họ là làm cho thế giới tốt hơn, cụ thể bằng cách giúp mọi người tiếp cận được với thông tin của nhân loại. Google đã tạo ra một công cụ đáng kinh ngạc có thể tận dụng tính chất kết nối của các mạng toàn cầu, một công cụ cho phép mọi người tìm kiếm thông tin, thậm chí cả những thông tin mơ hồ chỉ trong vòng vài giây. Công cụ tìm kiếm này đã thay đổi cách thức mọi người làm việc, giải trí và học tập. Google làm ra lợi nhuận lịch sử từ sản phẩm đó bằng cách tạo ra một hình thức quảng cáo mới không xâm phạm đến ai và thậm chí còn hữu ích cho mọi người. Công ty tuyển dụng những bộ óc sắc bén nhất trên thế giới và khuyến khích họ đối diện với những thách thức có thể đẩy ranh giới của sự đổi mới đi xa hơn. Sự tập trung của công ty vào việc mài giũa tài năng để hoàn thành mục tiêu khó khăn là một cảm hứng mang tầm quốc gia. Đôi khi, công ty thậm chí còn cảnh báo các cổ đông rằng có lúc nó sẽ theo đuổi các hoạt động kinh doanh phục vụ nhân loại, ngay cả khi hoạt động đó mang lại lợi nhuận thấp hơn. Nó thực hiện tất cả những thành quả đạt được với một sự ngang tàng tinh quái khiến cả cộng đồng phải mê đắm và biến nhân viên của mình thành những anh hùng.

Nhưng điều đó không quan trọng đối với những người phản đối trong phòng xử án của thẩm phán Chin. Những người này vốn ủng hộ cho Google, và họ nghĩ rằng Google không còn… tốt nữa. Sự mất lòng tin và nỗi sợ hãi trong phòng xử án đã được phản ánh qua nỗi lo lắng của các chính phủ bởi những chính sách riêng tư của Google và sự e ngại của các doanh nghiệp khi nghĩ rằng mình sẽ trở thành mục tiêu tiếp theo cho các hoạt động vô kỷ luật của Google. Các nhà quản lý Goolge đi tới đâu cũng phải đối mặt với phản đối và kiện tụng.

Diễn biến các sự kiện đã gây trở lại cho hai nhà sáng lập Google, Larry Page và Sergey Brin. Trong tất cả các dự án của Google, dự án gây tranh cãi trong phiên tòa – Dự án Thư Viện – có lẽ là lý tưởng nhất. Đó là một nỗ lực rất táo bạo nhằm số hóa mọi cuốn sách đã in để cho bất cứ ai trên thế giới cũng có thể định vị được thông tin trong đó. Google sẽ không cho không toàn bộ nội dung sách, thế nên khi người dùng tìm thấy những thông tin đó, họ sẽ có lý do để mua chúng. Các tác giả sẽ có được thị trường mới; người đọc sẽ có thể tiếp cận với tri thức rất nhanh chóng. Sau khi bị các nhà xuất bản và các tác giả khởi kiện, Google cam kết với họ rằng điều đó sẽ tạo điều kiện cho việc tiếp cận với các cuốn sách và mua ngay lập tức. Mọi thư viện sẽ nhận được một thiết bị đầu cuối4 miễn phí để kết nối với toàn bộ sách trên thế giới. Với Google, đó là một ân huệ cho cả nền văn minh.

Người ta không hiểu điều đó sao?

Dù sao đi nữa, công ty vẫn phát triển thịnh vượng. Google vẫn giữ được hàng trăm triệu người dùng, chủ trì hàng tỉ lệnh tìm kiếm mỗi ngày, và đã phát triển hoạt động sang cả video và các dịch vụ không dây. Nhân viên công ty vẫn luôn tin tưởng và kỳ vọng với những tình cảm tốt đẹp nhất. Nhưng bóng đen giờ đã phủ lên hình ảnh của Google. Với nhiều người ngoài, phương châm chung mà Google đã tâm đắc – “Đừng có làm kẻ ác” – đã trở thành một trò đùa, một công cụ để chống lại nó.

Đã có chuyện gì vậy?

Làm tốt là kế hoạch của của Larry Page ngay từ khi mới bắt đầu. Từ lúc còn nhỏ, anh đã muốn trở thành một nhà phát minh, không đơn thuần bởi vì đầu óc tư duy của anh hoàn toàn ăn khớp với mối liên hệ giữa lô gíc và công nghệ (thực sự là thế) mà còn bởi, anh nói: “Tôi thực sự muốn thay đổi thế giới.”

Page lớn lên ở Lansing, Michigan, ở đó, cha anh dạy khoa học máy tính ở trường đại học bang Michigan. Cha mẹ anh ly hôn khi anh được 8 tuổi, nhưng anh vẫn thân thiết với cha và mẹ – mẹ anh cũng có bằng cấp về khoa học máy tính. Một cách rất tự nhiên, ngôn ngữ máy tính trở thành ngôn ngữ chính của anh. Sau này, anh có chia sẻ với một phóng viên, “Tôi nghĩ mình là đứa trẻ đầu tiên trong trường tiểu học nộp bài ở dạng file word có xử lý.”

Page không phải là một động vật xã hội5 – những người nói chuyện với anh thường tự hỏi không biết liệu có chút biểu hiện nào của hội chứng Asperger6 trong anh không – và có thể làm cho người ta căng thẳng chỉ đơn giản bằng cách không nói năng gì. Nhưng khi đã nói, anh thường xổ ra những sáng kiến gần như quái dị. Việc tham gia vào một chương trình mùa hè về lãnh đạo (phương châm: “Nói không với không thể”) đã giúp thúc đẩy anh hành động. Ở đại học Michigan, anh trở nên ám ảnh về lĩnh vực vận tải và vạch ra kế hoạch cho một hệ thống đường tàu một ray tinh vi ở Ann Arbor, thay thế cho hệ thống xe buýt tầm thường với một hệ thống phương tiện “viễn tưởng” để di chuyển giữa ký túc xá và các phòng học. Anh dường như rất ngạc nhiên vì một ý tưởng siêu việt về giao thông trị giá nhiều triệu đô la từ một sinh viên chưa ra trường lại không nhanh chóng được đón nhận và thực hiện. (15 năm sau khi tốt nghiệp, Page đã đề cập lại vấn đề này trong một buổi họp với hiệu trưởng nhà trường.)

Không thể không ghi nhận trí thông minh và sức tưởng tượng của anh. Nhưng khi đã hiểu về anh thì bạn sẽ biết rằng điều nổi bật ở anh lại là tham vọng. Tham vọng đó thể hiện không chỉ như động lực cá nhân (dù cũng có cả yếu tố đó) mà là nguyên tắc chung rằng mọi người nên tư duy thật lớn lao và biến những điều lớn lao thành hiện thực. Anh tin rằng thất bại thực sự duy nhất là không thử những điều táo bạo. “Ngay cả nếu bạn thất bại với điều mà mình khao khát, thật khó để thất bại hoàn toàn,” anh nói. “Đó là điều mà mọi người không hiểu.” Page luôn luôn nghĩ về điều đó. Khi ai đó đề xuất một giải pháp ngắn hạn, bản năng của Page luôn là nghĩ cho dài hạn. Điều đó cuối cùng trở thành một câu chuyện đùa giữa những người trong Google, rằng Page “tới tương lai rồi quay về kể lại cho chúng tôi.”

Page kiếm được tấm bằng khoa học máy tính giống như cha mình. Nhưng số phận của anh là ở California, đặc biệt là ở Thung lũng Silicon. Theo một cách nào đó, tới Stanford chẳng khác gì chuyến hồi hương đối với Page. Anh sống ở đó một thời gian ngắn năm 1979 khi cha anh đi du khảo ở Stanford; một vài thành viên trong khoa vẫn nhớ anh, một cậu bé 7 tuổi với trí tò mò không bao giờ được thỏa mãn. Năm 1995, Stanford không chỉ là nơi duy nhất hoàn hảo cho việc theo đuổi ngành khoa học máy tính có vị trí tiên phong này mà, do bùng nổ Internet, còn là nơi tập trung tham vọng của cả thế giới. May mắn thay, Page đã để ý đến cả vấn đề thương mại: “Rất có thể là từ khi được 12 tuổi, tôi đã biết cuối cùng mình sẽ thành lập một công ty,” về sau anh kể lại. Anh trai của Page, lớn hơn anh 9 tuổi, đã ở Thung lũng Silicon và đang làm việc cho một công ty mới khởi nghiệp trong lĩnh vực Internet.

Page quyết định làm việc cho công ty Human-Computer Interaction. Lĩnh vực này sẽ trao cho Page một vị thế tốt trong tương lai về mặt phát triển sản phẩm, ngay cả khi việc tìm ra một mô hình mới để thu thập thông tin không phải là lĩnh vực chính của HCI. Trên bàn làm việc và thấm nhuần trong các cuộc trò chuyện của anh là bộ sách Tâm lý học cho những điều thường nhật (The Psychology of Everyday Things) của bậc thầy về giao diện của Apple, Donald Norman, kinh thánh của tín ngưỡng mà điều răn trước nhất, và có lẽ là duy nhất, nói rằng “Người dùng luôn luôn đúng.” Một cuốn sách gây ảnh hưởng khác là tiểu sử của Nikola Tesla, một nhà khoa học Xéc-bi tài năng; dù những cống hiến của Tesla được cho là có thể sánh ngang với Thomas Edison – và tham vọng của ông cũng đủ mãnh liệt để gây ấn tượng ngay cả với Page – ông đã chết trong hoàn cảnh chẳng mấy ai biết đến mình. “Tôi cảm thấy ông là một nhà phát minh vĩ đại và đó là một câu chuyện buồn,” Page nói. “Tôi cảm thấy đáng lẽ ông đã đạt được nhiều hơn rất nhiều nếu có thêm nguồn lực. Và ông đã gặp rắc rối khi thương mại hóa những thứ mình làm ra. Có lẽ nhiều rắc rối hơn ông nên có. Tôi nghĩ đó là một bài học tốt. Tôi không muốn chỉ phát minh ra các thứ, tôi còn muốn làm cho thế giới tốt đẹp hơn, và để làm được điều đó, ngoài phát minh, bạn còn phải làm nhiều việc nữa.”

Mùa hè trước khi nhập học tại Stanford, Page tham gia một chương trình dành cho các thí sinh trúng tuyển, trong đó có một chuyến đi tới San Francisco. Người hướng dẫn là một sinh viên đã tốt nghiệp tầm tuổi Page, vừa học ở Stanford trong hai năm. “Hồi đó tôi nghĩ anh ta khá là đáng ghét,” Page sau này nói về người hướng dẫn, Sergey Brin. Nội dung của cuộc chạm trạn bây giờ chỉ còn như câu chuyện cổ tích, nhưng bất chấp sự trái ngược trong tính cách, theo một cách nào đó thì họ giống nhau y hệt. Cả hai đều cảm thấy thoải mái nhất với chế độ nhân tài của giới học viện, nơi trí tuệ là vua. Cả hai, từ trong máu, đều thấu hiểu cái thế giới liên kết cực kỳ chặt chẽ mà họ tận hưởng với tư cách là các sinh viên về khoa học máy tính (CS) sẽ mở rộng ra toàn xã hội. Cả hai cùng chia sẻ niềm tin cốt tủy về tính ưu việt của số liệu. Và cả hai đều cực kỳ bướng bỉnh khi theo đuổi niềm tin của mình. Khi Page ổn định vào tháng 9 năm đó, anh trở thành bạn thân với Brin, đến mức mọi người nhắc tới họ như một bộ: LarryvàSergey.

Sinh ra ở Nga, Brin lên bốn khi gia đình anh nhập cư vào Mỹ. Tiếng Anh của anh vẫn còn phảng phất ngữ âm của Nga, và cách nói chuyện của anh thi thoảng vẫn còn tí chút cách thể hiện lỗi thời của Thế giới Cũ như cách diễn đạt “whatnot” trong khi bạn bè cùng trang lứa thì nói “stuff like that”7. Anh tới Stanford vào năm 19 tuổi lướt vèo qua Đại học Maryland, nơi cha anh dạy học, trong ba năm; anh là một trong những sinh viên trả nhất từ trước tới nay bắt đầu học chương trình tiến sĩ ở Stanford. “Anh ấy bỏ qua cả triệu năm,” Craig Silverstein, người tới Stanford một năm sau, và sau này đã trở thành nhân viên đầu tiên của Google. Sergey là một cậu nhóc tinh quái lướt vèo vèo qua những hành lang của Stanford trên chiếc giày trượt. Anh còn rất yêu thích môn xà đu. Nhưng các giảng viên hiểu rằng đằng sau vẻ ngoài ngốc nghếch đó là một tư duy toán học đáng nể. Chẳng bao lâu sau khi tới Stanford, anh chinh phục tất cả các bài kiểm tra mà học vị tiến sĩ phải có và được tự do thử tất cả các khóa học cho tới khi tìm được cách tiếp cận thích hợp cho luận án. Anh bổ sung những hoạt động hàn lâm của mình bằng bơi lội, thẻ dục và chèo thuyền. (Khi cha anh hỏi trong tuyệt vọng rằng liệu anh có kế hoạch học tiếp các khóa cao cấp không, anh nói chắc anh sẽ học bơi cao cấp.) Donald Knuth, một giảng viên của Stanford – tác giả của loạt sách lẫy lừng về nghệ thuật lập trình máy tính đã khiến ông được mệnh danh là Proust8 của mã máy tính – nhớ lại chuyện lái xe xuống bờ biển Thái Bình dương để đàm đạo với Sergey vào một buổi chiều nọ và đã vô cùng ấn tượng với sự am tường các vấn đề phức tạp của anh. Cố vấn của anh, Hector Garcia-Molina, đã gặp rất nhiều cậu bé thông minh học qua Stanford, nhưng Brin nổi bật hẳn. “Cậu ấy quả là thiên tài,” Garcia-Molina nhận xét.

Một nhiệm vụ mà Brin thực hiện là hệ thống đánh số cho Tòa nhà Khoa học Máy tính Gates – tòa nhà này sẽ là trụ sở của bộ môn. (Hệ thống của anh sử dụng những tinh hoa toán học). Công trình được đặt tên theo William Henry Gates III, được biết đến nhiều hơn dưới cái tên Bill, đồng sáng lập Microsoft. Mặc dù Gates đã học hai năm ở Harvard và đã hiến tặng một tòa nhà được đặt theo tên mẹ ông ở đó, ông tiếp tục phô trương tí xíu bằng việc tài trợ cho những trụ sở mới nguy nga của các bộ môn khoa học máy tính thuộc các tổ chức công nghệ hàng đầu mà ông không theo học, bao gồm MIT và Carnegie Mellon – cùng với Stanford, ba tổ chức đứng đầu trong các chương trình CS. Ngay cả cười vào mũi Windows, thế hệ sau của các thầy phù thủy vẫn học trong những tòa nhà đặt theo tên Bill Gates.

Liệu Gates có bao giờ tưởng tượng được rằng một trong những tòa nhà đó sẽ nuôi dưỡng một đối thủ có khả năng hủy diệt Microsoft không?

Chương trình tiến sĩ khoa học máy tính ở Stanford được xây dựng quanh mối quan hệ thân thiết giữa sinh viên và thành viên trong khoa. Họ tập trung lại thành nhóm để giải quyết những vấn đề to lớn, thực tế; cách nhìn mới mẻ của những con người trẻ trung giúp duy trì sinh khí cho những mối quan tâm của giảng viên. “Bạn lúc nào cũng bị cuốn theo sinh viên,” Terry Winograd, cố vấn của Page, nói. Qua nhiều năm, Winograd đã trở thành chuyên gia trong việc xác định xem sinh viên đang ở vị trí nào trong thế giới những bộ óc vĩ đại của những người tìm được đường vào khoa này. Một vài cậu có thành tích trước khi tốt nghiệp là toàn là A+, điểm GRE9 xấp xỉ mức tối đa, nhưng sẽ luôn hỏi: “Em nên thực hiện luận án nào?” Cực bên kia của thế giới này là những nghiên cứu sinh như Larry Page, những anh chàng này thường khẳng định: “Đây là việc em nghĩ em có thể làm.” Và những đề xuất của anh chàng này thì đúng là điên rồ. Cậu sẽ vào văn phòng và nói về việc làm gì đó với dây cáp không gian hay những cánh diều năng lượng mặt trời. “Đó là khoa học viễn tưởng nhiều hơn là khoa học máy tính,” Winograd nhớ lại. Nhưng một tư duy lạ lùng là một tài sản quý giá, và chắc chắn là có một chỗ trong nền khoa học hiện tại để khơi thông sức sáng tạo dữ dội.

Vào năm 1995, chỗ đó chính là Mạng toàn cầu World Wide Web. Nó bắt nguồn từ một bộ óc hoạt động không ngừng của một kỹ sư (hồi đó) kỳ quặc người Anh tên Tim Berners-Lee, một kỹ thuật viên ở phòng thí nghiệm nghiên cứu vật lý CERN, Thụy Điển. Berners-Lee có thể tổng kết tầm nhìn của mình trong một câu: “Giả sử thông tin lưu trữ trong máy tính ở khắp nơi liên kết được với nhau… thì sẽ có một không gian thông tin duy nhất trên toàn cầu.”

Trước thời điểm vinh quang của Berners-Lee, đã tồn tại một hệ thống khổng lồ, nơi người ta có thể tự do đăng tải và kết nối tài liệu của mình: Mạng Internet. Mặc dù những website đầu tiên chỉ là cách để phân phối các bài viết hàn lâm hiệu quả hơn, người ta nhanh chóng bắt tay vào việc viết các trang với đủ các loại thông tin và những người khác thì tạo ra các trang chỉ để giải trí. Giữa những năm 1990, người ta bắt đầu sử dụng mạng với mục đích lợi nhuận, và một từ mới, “thương mại điện tử” (e-commerce) xuất hiện trong vốn từ vựng của nhân loại với những gã khổng lồ như Amazom.com hay eBay.

Khi mạng phát triển hơn, cấu trúc kết nối của nó tích lũy được một giá trị phi thường. Tất cả các nội dung trên mạng được sắp xếp như một tổ hợp ý tưởng lớn, bất cứ ý tưởng nào cũng có thể được tiếp cận bằng hành động kết nối một tài liệu này với một tài liệu khác. Khi nhìn vào một trang, bạn có thể thấy những chỉ dẫn tới các trang khác mà chủ web đã mã hóa trên trang này, thường được đánh dấu màu xanh da trời – đó chính là ý tưởng siêu văn bản đã từng thôi thúc Bush, Nelson và Atkinson10. Nhưng lần đầu tiên, đúng như Berners-Lee dự tính, mạng đã thu hút được một số lượng cực lớn các trang và tài liệu kết nối với nhau tập trung vào một mạng duy nhất. Thực tế là, mạng đã trở thành một cơ sở dữ liệu vô tận, một dạng thế giới đang mở rộng điên cuồng của tri thức nhân loại mà, theo lý thuyết, có thể chứa đựng mọi hiểu biết, suy nghĩ, hình ảnh và sản phẩm để bán. Và tất cả liên kết chéo với nhau trong một mạng lưới chằng chịt được tạo ra bởi hoạt động kết nối độc lập của bất cứ ai đã từng xây dựng nên một trang và mã hóa một kết nối tới một nơi nào đó khác trên mạng.

Sáng tạo của Berners-Lee mới mẻ đến nỗi khi Stanford nhận được tài trợ từ Quỹ Khoa học Quốc gia NSF vào đầu những năm 1990 để bắt đầu một chương trình có tên gọi Dự án Thư viện Số, mạng đã không hề được nhắc tới trong đề xuất. “Chủ đề chính của dự án là khả năng tương tác giữa các phần – làm thế nào để khiến cho những nguồn lực này phối hợp với nhau?” Hector Garcia-Molina – người đồng sáng lập dự án – nhớ lại. Tuy nhiên, tới năm 1995, Garcia-Molina biết rằng Mạng Toàn cầu sẽ là một phần không thể thiếu của các dự án được dựng lên bởi những sinh viên đã làm việc với chương trình này, trong đó có Page và Brin.

Brin vốn đã có quan hệ với Quỹ Khoa học Quốc gia và không cần tài trợ, nhưng anh đã cố gắng tìm ra một đề tài luận án. Anh tập trung chủ yếu vào việc khai thác số liệu, và với Rajeev Motwani, một giảng viên trẻ khá thân thiết với Brin, anh đã giúp khởi động một nhóm nghiên cứu gọi là MIDAS, viết tắt cho Mining Data at Stanford (Khai thác số liệu ở Stanford). Trong một hồ sơ cá nhân được đăng tải trên trang của Stanford năm 1995, anh nhắc tới một “dự án mới” nhằm tạo ra hệ thống xếp hạng phim được cá nhân hóa. “Nó hoạt động như sau,” anh viết. “Bạn đánh giá các bộ phim mình đã xem. Rồi hệ thống sẽ tìm kiếm những người dùng khác với gu thưởng thức tương tự để ngoại suy mức độ bạn thích các bộ phim khác.” Một dự án mà anh tiến hành cùng Garcia-Molina và một sinh viên khác là hệ thống phát hiện vi phạm bản quyền bằng các chương trình tự động tìm kiếm bản sao của các tài liệu. “Cậu ấy đã nghĩ ra một vài thuật toán hay để phát hiện các bản sao,” Garci-Molina kể. “Giờ thì bạn sử dụng Google.”

Lúc đó, Page cũng đang tìm đề tài luận án. Một ý tưởng mà anh trình bày với Winograd, một sự hợp tác với Brin, có vẻ hứa hẹn hơn những ý tưởng khác: tạo ra một hệ thống mà ở đó người ta có thể đề lời chú giải và bình luận trên các website. Nhưng Page càng nghĩ về việc chú giải, nó lại càng rối tinh. Với các site lớn, hẳn sẽ có rất nhiều người muốn đánh dấu một trang. Làm thế nào bạn xác định được ai là người được phép bình luận hay bình luận của người nào bạn sẽ xem đầu tiên? Vì thế, anh nói: “Chúng ta cần một hệ thống xếp hạng.”

Chắc chắn là chúng ta sẽ không sử dụng con người để quyết định các thứ bậc. Thứ nhất đó là việc quá phi thực tế. Hơn nữa, con người thì không đáng tin. Chỉ có các thuật toán – được đúc rút tốt, được xử lý hiệu quả và được dựa trên số liệu hợp lý – mới có thể đưa ra những kết quả khách quan. Như vậy, vấn đề là cần tìm ra số liệu thích hợp để quyết định xem bình luận của ai đáng tin cậy, hoặc thú vị, hơn những người khác. Page nhận ra rằng những số liệu như thế vẫn luôn tồn tại và chưa có ai khác thực sự sử dụng đến nó. Anh hỏi Brin, “ Tại sao chúng ta lại không sử dụng các kết nối trên mạng để làm việc đó nhỉ?”

Page, lớn lên trong môi trường hàn lâm, hiểu rằng các kết nối trên mạng cũng giống như các câu trích dẫn trong một bài báo có tính học thuật. Ai cũng hiểu rằng bạn sẽ có thể biết được bài báo nào là thực sự quan trọng mà không cần phải đọc chúng – chỉ bằng cách tổng kết lại xem có bao nhiêu tờ báo khác dẫn chiếu đến chúng trong phần ghi chú và phụ lục tài liệu. Page tin rằng nguyên tắc này cũng có thể phát huy tác dụng với các trang mạng. Nhưng để có được số liệu phù hợp thì không dễ. Các trang mạng đều tạo đường link rất rõ ràng. Dựng thành mã là cách đánh dấu rất dễ xác định cho những đích đến mà bạn có thể di chuyển tới bằng một cú nhấp chuột từ một trang. Nhưng những điều được kết nối đến một trang lại không rõ ràng chút nào. Để tìm được ra điều đó, bạn phải làm sao thu thập được cơ sở dữ liệu của các đường dẫn kết nối với một vài trang khác. Lúc đó, bạn sẽ đi quay ngược lại.

Vì thế, mà Page gọi hệ thống của mình là Backup và Winograd nghĩ rằng đó là ý tưởng tuyệt vời cho một dự án, nhưng không phải một dự án đơn giản. Để làm được điều đó, ông nói với Page, cậu thực sự phải hiểu rõ được cấu trúc kết nối của Mạng Toàn cầu. Page nói, chắc chắn rồi, anh sẽ tìm, tải mạng về và tìm hiểu cấu trúc. Anh cho rằng việc này sẽ mất chừng một tuần. “Và tất nhiên,” sau này anh nhớ lại, “việc đó đã mất tầm hàng năm.” Nhưng Page và Brin đã xông vào nó. Tất cả những tuần khác, Page đều tới văn phòng của Garcia-Molina hỏi xin đĩa và thiết bị. “Tốt thôi,” Garcia-Molina sẽ nói. “Đó là một dự án tuyệt vời, nhưng các cậu cần kiếm kinh phí cho tôi.” Ông yêu cầu Page chọn một con số, để cho biết anh cần mầy mò bao nhiêu về mạng nữa và để ước tính còn cần bao nhiêu đĩa nữa. “Tôi muốn mầy mò toàn bộ mạng,” Page nói.

Page thỏa mãn bản thân với đôi chút tự mãn khi đặt tên phần hệ thống xếp hạng các website dựa trên các kết nối đến là chương trình xếp hạng Page (PageRank). Nhưng đó là một kiểu tự mãn tinh quái; rất nhiều người cho rằng cái tên đó là muốn nói tới các trang mạng (web pages) chứ không phải tên người.

Vì Page không phải là một nhà lập trình tầm thế giới, anh đề nghị một người bạn giúp sức. Scott Hassan là trợ lý nghiên cứu toàn thời gian tại Stanford, làm việc cho chương trình Dự án thư viện số. Hassan cũng là bạn tốt của Brin, hai người gặp nhau trong một trận Ultimate Frisbee11 vào tuần đầu tiên của anh ở Stanford. Chương trình của Page “có quá nhiều lỗi, điều đó chẳng đáng cười chút nào,” Hassan kể lại. Anh quyết định lấy chương trình của Page và viết lại nó thành ngôn ngữ mà anh hiểu rõ hơn, và không có lỗi nào hết.

Anh viết một chương trình bằng Python – một ngôn ngữ linh hoạt hơn mà về sau đã trở nên thông dụng cho các chương trình trên nền web – hoạt động như một “con nhện”, gọi như vậy là bởi vì nó sẽ len lỏi khắp trên mạng để tìm số liệu. Chương trình sẽ ghé thăm một trang web, tìm tất cả các kết nối và xếp chúng theo thứ tự. Rồi nó sẽ kiểm tra xem trước đây mình đã ghé thăm những trang liên kết này chưa. Nếu chưa, nó sẽ xếp kết nối vào dạng đích đến sẽ ghé thăm trong tương lai và lặp lại quy trình. Bởi vì Page không quen thuộc với Python, Hassan trở thành thành viên của nhóm. Anh và một sinh viên khác, Alan Steremberg, trở thành trợ lý có hưởng lương của dự án.

Brin, nổi trội về toán, nhận một nhiệm vụ vô cùng lớn là nghiền ngẫm những phép toán giúp làm rõ mớ bòng bong những kết nối mà cuộc khảo sát khổng lồ về một mạng Internet đang ngày càng phát triển của họ đã tìm ra.

Mặc dù hoạt động của nhóm đã có được những bước tiến nhất định, họ vẫn không chắc lắm đích đến của mình là gì. “Larry không có kế hoạch nào cả,” Hassan kể. “Trong nghiên cứu, bạn khám phá thứ gì đó và xem có trở ngại gì không.”

Khoảng tháng 3 năm 1996, họ bắt đầu một đợt kiểm tra, khởi đầu ở một trang đơn lẻ, trang chủ của Bộ môn khoa học máy tính ở Stanford. Con nhện đã định vị được các kết nối trên trang và tỏa ra khắp các sites có liên kết đến Stanford, rồi tới các sites liên kết tới những website đó. “Đợt đầu tiên đó chỉ sử dụng tựa đề của các tài liệu vì thu thập chính các tài liệu sẽ đòi hỏi rất nhiều số liệu và công sức,” Page giải thích. Sau khi thu gom được khoảng 15 triệu tựa đề như vậy, họ kiểm tra chương trình để xem các website nào có vẻ như có nhiều quyền lực hơn.

“Ngay cả bộ kết quả đầu tiên cũng rất có tính thuyết phục,” Hector Garcia-Molina nói. “Ai xem chương trình chạy thử này cũng thấy rõ là đây là một cách rất tốt, rất tuyệt vời để sắp xếp mọi thứ.”

“Chúng tôi nhận thấy rằng nó làm việc thực sự, thực sự tốt,” Page chia sẻ. “Và tôi nói: ‘Chà, vấn đề lớn ở đây không phải là ghi chú. Chúng ta nên sử dụng nó không chỉ để xếp hạng các ghi chú mà còn để xếp hạng các tìm kiếm nữa.’” Đây dường như là một ứng dụng đương nhiên cần có cho một phát minh có thể đưa ra thứ hạng cho mọi trang trên mạng. Anh nói: “Với tôi và những người còn lại của nhóm thì rõ ràng là nếu bạn có cách xếp hạng mọi thứ dựa trên không chỉ chính trang đó mà còn trên cả những điều mà thế giới nghĩ về trang đó thì đó sẽ là điều thực sự có giá trị cho việc tìm kiếm.”

Dẫn đầu trong lĩnh vực tìm kiếm trên mạng vào thời đó là một chương trình có tên AltaVista, sản phẩm của Phòng thí nghiệm Nghiên cứu Phương Tây thuộc Tập đoàn Thiết bị Số (DEC). Nhà thiết kế chính là Louis Monier, một người Pháp kỳ dị đồng thời là một con mọt máy tính đầy lý tưởng, người đã tới Mỹ với tấm bằng tiến sĩ từ năm 1980. DEC được tạo dựng trên máy tính mini, đã từng là một lĩnh vực tân tiến mà nay đã bị cuộc cách mạng máy tính cá nhân đẩy vào chỗ tuyệt diệt. “DEC cứ đắm mình trong quá khứ,” Monier nói: “Nhưng họ có một nhóm nhỏ những người tư duy rất tiến bộ, thử nghiệm với rất nhiều loại đồ chơi.” Một trong những đồ chơi đó chính là mạng. Bản thân Monier không phải chuyên gia trong lĩnh vực thu thập thông tin nhưng lại vô cùng hâm mộ số liệu về mặt lý thuyết. “Với tôi, đó là số liệu bí mật,” ông nói. Điều mà số liệu nói với ông là nếu bạn có những công cụ thích hợp, thì bạn hoàn toàn có thể đối xử với mọi thứ trên mạng mở như với một tài liệu đơn lẻ.

Ngay cả ở buổi sơ khai đó, nền tảng cơ bản của tìm kiếm trên mạng đã được thiết lập sẵn. Tìm kiếm là một quy trình bốn bước. Đầu tiên là một lượt quét nhanh qua tất cả các trang mạng trên thế giới, qua một con nhện. Thứ hai là lập bảng chú giải cho các thông tin mà con nhện thu về và lưu giữ số liệu trên máy chủ. Bước thứ ba, phân tích yêu cầu của người dung để xác định các trang có vẻ như phù hợp nhất để trả lời cho câu hỏi. Kết quả đó được gọi là chất lượng tìm kiếm. Bước cuối cùng liên quan đến việc định dạng và đưa các kết quả đó tới người dùng.

Monier quan tâm nhất tới bước thứ hai, quá trình ngốn thời gian để bò khắp hàng triệu tài liệu và gom số liệu. “Hồi đó quá trình mầy mò còn chậm, bởi vì đầu bên kia sẽ phải mất chừng bốn giây để trả lời,” Monier nói. Một ngày nọ, khi đang nằm bên bể bơi, ông nhận ra là bạn có thể thu được mọi thứ một cách nhanh chóng bằng cách thực hiện song song quá trình, gom số liệu từ nhiều trang cùng một lúc. Con số phù hợp, ông kết luận, là một nghìn trang một lúc. Monier tìm ra cách tạo được bọ tìm kiếm có khả năng làm việc với quy mô như vậy. “Trên một máy tôi có một nghìn chuỗi, các quy trình độc lập yêu cầu mọi thứ và không dẫm vào chân nhau.”

Đến cuối năm 1995, mọi người ở Phòng thí nghiệm Nghiên cứu Phương Tây DEC đều đã sử dụng công cụ tìm kiếm của Monier. Ông đã phải rất khó khăn mới có thể thuyết phục các vị sếp của mình đưa công cụ này ra công chúng. Họ tranh luận rằng chẳng có cách nào để kiếm được tiền từ một công cụ tìm kiếm nhưng rồi cũng dịu lại khi Monier bán chúng trong lĩnh vực quan hệ công chúng. (Hệ thống sẽ là một minh chứng cho sản phẩm chip xử lý Alpha mới rất mạnh của DEC.) Vào ngày ra mắt, AltaVista có 16 triệu tài liệu trong chỉ mục của mình, dễ dàng qua mặt bất cứ một công cụ nào khác trên mạng. “Những chỉ mục lớn hồi đó có lẽ có khoảng một triệu trang,” Monier nói. Đó là sức mạnh của AltaVista: Bề rộng. Khi DEC mở sản phẩm này ra cho cả người ngoài vào tháng 12 năm 1995, gần 300.000 người đã dùng thử. Họ đều choáng ngợp.

Các công nghệ chất lượng tìm kiếm thực sự của AltaVista – điều quyết định thứ tự xếp hạng của các kết quả – được dựa trên các thuật toán thu thập thông tin (IR – Informtaion Retrieval) truyền thống. Nhiều trong số những thuật toán đó được phát triển từ công trình của một người tị nạn từ Nazi, Đức, tên là Gerard Salton – người đã tới Mỹ, có được tấm bằng tiến sĩ ở Harvard và chuyển tới đại học Cornell. Tại đây, ông cùng đồng nghiệp đã sáng lập ra bộ môn khoa học máy tính. Tìm kiếm qua cơ sở dữ liệu sử dụng cùng các lệnh mà bạn dùng với con người – “ngôn ngữ tự nhiên” trở thành một khái niệm nghệ thuật – là chuyên của Salton.

Suốt những năm 1960, Salton đã phát triển một hệ thống mà sau này trở thành hình mẫu cho việc thu thập thông tin. Nó được gọi là SMART, được cho là viết tắt của cụm từ “Bộ máy thu thập văn bản kỳ diệu của Salton” (Salton’s Magical Retriever of Text). Hệ thống thiết lập nên nhiều quy ước mà đến nay vẫn còn tồn tại trong công nghệ tìm kiếm, bao gồm phân loại và các thuật toán tương ứng. Khi Salton mất năm 1995, công nghệ của ông vẫn còn thống trị trong lĩnh vực này. Một năm sau đó, một viện sĩ thành kính viết “Trong 30 năm, Gerry Salton đã là biểu tượng của thu thập thông tin trong 30 năm.”

Mạng toàn cầu sắp thay đổi điều đó, nhưng các viện sĩ không hề biết – và AltaVista cũng vậy. Mặc dù những người sáng tạo ra nó có ý thức thu thập tất cả mọi thứ trên mạng, họ bỏ lỡ mất cơ hội tận dụng cấu trúc liên kết. “Đột phá là ở chỗ tôi không ngại đem về nhiều mạng hết sức có thể, lưu nó lại vào một chỗ, và có thời gian phản ứng thực sự nhanh chóng. Đó chính là điểm mới lạ,” Monier nói. Trong khi đó, AltaVista phân tích nội dung ở mỗi trang cụ thể – sử dụng các thước đo như mỗi từ xuất hiện bao nhiêu lần – để xem liệu trang đó có khớp với một từ đưa ra trong câu lệnh hay không.

Ngay cả khi không có cách rõ ràng nào để kiếm tiền từ việc tìm kiếm, AltaVista cũng đã có một vài đối thủ. Đến năm 1996, khi tôi viết về việc tìm kiếm cho tờ Newsweek, các nhà lãnh đạo từ một số công ty đều vỗ ngực tự nhận là có dịch vụ hữu ích nhất. Khi bị dồn, tất cả bọn họ đều thừa nhận rằng trong cuộc đua giữa mạng internet hổ lốn và công nghệ mới ra đời của họ, mạng chiếm phần thắng. “Công nghệ IR kiểu học thuật đã mất 30 năm để có được vị trí này – chúng tôi đang khai phá vùng đất mới, nhưng thật khó khăn,” Graham Spencer, người kỹ sư đứng đằng sau công cụ tìm kiếm do một công ty khởi nghiệp tên là Excite tạo ra than phiền. Giám đốc phụ trách kỹ thuật của Alta Vista, Barry Rubinson nói: “Vấn đề đầu tiên là sự tương thích phụ thuộc vào đánh giá của từng người. Vấn đề thứ hai là hiểu được ý nghĩa của những câu lệnh ngắn đến kỳ dị và vô cùng khó hiểu được gõ vào ô tìm kiếm của Alta Vistra.”

Không ai trong các công ty tìm kiếm nhắc đến chuyện sử dụng các liên kết.

Các liên kết là lý do dự án nghiên cứu của Stanford trở thành mối quan tâm hàng đầu. Chương trình Xếp hạng PageRank của Larry Page rất hiệu quả vì rõ ràng là nó phân tích những liên kết này và gán cho chúng một con số, một thước đo theo thang từ 1 đến 10, cho phép bạn thấy được độ nổi bật của trang so với mọi trang khác trên mạng. Một trong những phiên bản đầu tiên của BackRub mới chỉ đơn giản là đếm những liên kết đến, nhưng Page và Brin đã nhanh chóng nhận ra rằng không chỉ số lượng các liên kết mà cả người đang thực hiện liên kết cũng tạo sự liên quan giữa các yếu tố. PageRank phản ánh được thông tin đó. Tình trạng trang tạo ra liên kết đó càng nổi bật, liên kết đó càng có giá trị và càng được đánh giá cao khi tính toán con số PageRank cuối cùng của chính trang web đó. “Ý tưởng đằng sau PageRank là bạn có thể đánh giá tầm quan trọng của trang web bằng các trang web liên kết tới nó,” Brin nói. “Thực ra, chúng tôi phát triển nhiều bài toán để giải quyết vấn đề đó. Các trang quan trọng có xu hướng liên kết tới những trang quan trọng. Chúng tôi chuyển đổi toàn bộ mạng thành một phương trình lớn với vài trăm triệu biến số, tức là số hạng PageRank của tất cả các trang web, và hàng triệu điều kiện, tức là tất cả các liên kết.” Đó chính là phép tính toán mà Brin sử dụng cho khoảng 500 triệu biến số để xác định các trang quan trọng. Điều này giống như việc nhìn vào một bản đồ đường hàng không: Các thành phố trung tâm sẽ nổi bật lên nhờ tất cả các đường thể hiện các chuyến bay đến và đi từ đó. Các thành phố có nhiều đường giao thông kết nối với các trung tâm khác nhất rõ ràng là trung tâm chính của khu vực dân cư. Điều tương tự cũng áp dụng được cho các website. “Tất cả là phép hồi quy,” Page kể lại. “Theo một cách nào đó, mức độ tuyệt vời của bạn được quyết định bởi những người liên kết tới bạn, và những người bạn liên kết tới sẽ quyết định bạn tuyệt đến đâu. Đó là một vòng tròn lớn. Nhưng toán học rất kỳ diệu. Bạn có thể giải quyết được điều đó.”

Điểm xếp hạng PageRank sẽ được kết hợp với một số của các công nghệ thu thập thông tin truyền thống hơn, ví dụ như so sánh từ khóa với nội dung văn bản trên trang và quyết định mối liên quan bằng cách kiểm tra các yếu tố như tần suất, cỡ phông chữ, viết hoa và vị trí của từ khóa. Những yếu tố đó được biết đến như những tín hiệu, và chúng rất quan trọng đối với chất lượng tìm kiếm. Có một số mili giây cực kỳ quan trọng trong quy trình tìm kiếm trên mạng, trong quãng đó, công cụ sẽ diễn giải từ khóa và tiếp cận với một chỉ mục rộng lớn, nơi tất cả nội dung văn bản trên hàng tỉ trang được lưu trữ và sắp xếp giống như mục lục trong một cuốn sách. Tại điểm đó, công cụ cần được giúp đỡ để xác định cách sắp xếp những trang đó. Vì thế, nó tìm kiếm các dấu hiệu – các đặc điểm có thể giúp công cụ phát hiện được những trang thỏa mãn câu hỏi. Tự bản thân PageRank cũng là một dấu hiệu. Một trang web với thứ hạng PageRank cao gửi đi thông điệp tới công cụ tìm kiếm rằng nó là một nguồn đáng tin cậy hơn những trang có thứ hạng thấp hơn.

Mặc dù PageRank là cây đũa thần của BackRub, nó chỉ là sự kết hợp của thuật toán đó với các tín hiệu khác để tạo ra những kết quả đáng kinh ngạc. Nếu từ khóa khớp với tựa đề của trang web hay tên miền, trang đó sẽ được xếp hạng cao hơn. Với những lệnh tìm có nhiều từ, các tài liệu có chứa tất cả các từ sát với các từ trong lệnh tìm kiếm thường sẽ được ghi nhận nhiều giá trị hơn những trang có chứa các cụm không hề liên quan chút nào. Một tín hiệu mạnh mẽ khác là “nội dung đường dẫn” của các kết nối dẫn tới trang. Ví dụ, nếu một trang web sử dụng từ “Bill Clinton” để kết nối đến Nhà Trắng, “Bill Clinton” sẽ là nội dung đường dẫn. Bởi vì giá trị cao được gán cho nội dung đường dẫn, một lệnh BackRub cho “Bill Clinton” sẽ đặt trang www.whitehouse.gov lên vị trí kết quả đầu tiên bởi vì có rất nhiều trang web có thứ hạng PageRank cao sử dụng tên của vị tổng thống này để liên kết tới site của Nhà Trắng. “Khi bạn thực hiện một lệnh tìm kiếm, trang phù hợp sẽ xuất hiện, thậm chí nếu trang đó không có chứa đúng những từ mà bạn đang tìm kiếm,” Scott Hassan nói. “Điều đó khá là tuyệt.” Đó cũng là điều mà các công cụ tìm kiếm khác không làm được.

PageRank còn có một lợi thế lớn khác. Đối với các công cụ tìm kiếm phụ thuộc vào phương thức IR truyền thống để phân tích nội dung, mạng đề ra một thách thức khủng khiếp. Có hàng triệu và hàng triệu trang, và ngày càng nhiều trang được thêm vào, hiệu quả hoạt động của các hệ thống đó hiển nhiên giảm sút. Đối với những site đó, tốc độ mở rộng của mạng chính là vấn đề, sự kiệt quệ trong các nguồn lực của họ. Nhưng nhờ có PageRank, mạng càng phát triển, BackRub càng tốt lên. Nhiều site hơn đồng nghĩa với nhiều liên kết hơn. Những thông tin thêm vào này cho phép BackRub xác định càng chính xác hơn những trang có thể liên quan tới câu hỏi. Và càng có nhiều liên kết thì càng cải thiện được sự mới mẻ của site. “PageRank có được lợi ích từ việc học tập từ toàn bộ Mạng toàn cầu.” Brin giải thích.

Tất nhiên, Brin và Pge cũng gặp phải một số vấn dề khi cố gắng thâu tóm toàn bộ mạng. Những ngày đó, rất nhiều trong số những người điều hành các website chỉ hiểu biết về công nghệ ở mức tối thiểu – không quen với việc các site của mình bị sục xạo. Một số người nhìn vào nhật ký của mình và thấy những chuyến ghé thăm thường xuyên từ trang www.stanford.edu nên nghi ngờ rằng trường rất có thể đang lấy cắp thông tin của họ. Về mặt lý thuyết, họ có thể chặn sự ghé thăm của các con “bọ tìm kiếm” của Google bằng cách đặt một đoạn mã nhỏ trên các sites của họ gọi là /robots.txt, nhưng các chủ web tức giận không hề lĩnh hội khái niệm đó. “Larry và Sergey làm cho mọi người bực mình đến nỗi không nghĩ ra nổi /robots.txt,” Winograd kể, “nhưng cuối cùng, họ đã thực sự dựng lên một danh sách cấm ghé thăm, điều mà họ không hề muốn.” Thậm chí cả khi đó, Page và Brin vẫn tin vào hệ thống tự phục vụ hoạt động trên diện rộng, phục vụ cho cộng đồng dân cư lớn. Các biện pháp ngăn chặn thủ công bị ghét cay ghét đắng.

Brin và Page rơi vào một cái vòng luẩn quẩn. Nếu các trang đưa ra cho một câu hỏi nhất định không được sắp xếp theo một trình tự hợp lý, họ sẽ quay trở lại thuật toán và xem có điều gì chưa đúng. Gán tỷ trọng hợp lý cho các tín hiệu khác nhau là một hành động cân bằng không đơn giản. Page nói. Page sử dụng hệ thống xếp hạng cho từ khóa “đại học” như một thí nghiệm thử quỳ. Anh chú ý đặc biệt tới thứ hạng tương ứng của ngôi trường đầu tiên của mình, Michigan, và ngôi trường hiện tại, Stanford. Brin và Page cho rằng Stanford sẽ được xếp hạng cao hơn, nhưng Michigan lại vượt qua nó. Liệu đó có phải là một thiếu sót trong thuật toán không? Không. “Chúng tôi quyết định rằng Michigan có nhiều thứ trên mạng hơn và điều đó là hợp lý,” Page giải thích.

Việc tạo danh sách này thể hiện sức mạnh của PageRank. Nó khiến cho BackRub hữu dụng hơn nhiều so với các kết quả mà bạn có được từ các công cụ tìm kiếm thương mại.

Page và Brin đã cho ra mắt dự án của mình như một bàn đạp cho những Luận án mà mình có thể thực hiện. Nhưng không thể chối cãi được là họ bắt đầu nhìn sản phẩm sáng tạo của mình như một thứ gì đó có thể kiếm ra tiền cho họ. Chương trình khoa học máy tính của Stanford vừa là một tổ chức hàn lâm, vừa không khác gì vườn ươm doanh nghiệp. David Cheriton, một trong các giảng viên, từng nhận định: “Lợi thế bất công mà Stanford có được so với bất cứ nơi nào khác trong cái vũ trụ này là bao quanh chúng tôi là Thung lũng Silicon.” Không hề hiếm việc các giáo sư của trường có chân trong cả hai thế giới, vừa nghiên cứu và giảng dạy tại khoa, vừa hoạt động trong lĩnh vực công nghệ cao của các công ty khởi nghiệp đang cố gắng giành lấy thành công rực rỡ. Thậm chí còn có một câu nói đùa rằng các thành viên trong khoa sẽ không được vào biên chế cho tới khi họ mở công ty.

Bản thân Cheriton là một ví dụ điển hình cho cách mạng lưới Stanford cho ra đời các công ty và làm giàu cho những người sáng lập. Một trong những cú ghi bàn vàng đầu tiên từ Stanford là việc thành lập Sun Microsystem do một nhóm gồm Andy Bechtolsheim, Vinod Khosla, và Bill Joy thực hiện. Cheriton rất gần gũi với Bechtolsheim, vì thế năm 1995, khi Bechtolsheim quyết định thành lập Granite Systems, một công ty khởi nghiệp về mạng, họ đã liên kết với nhau. 18 tháng sau, Cisco mua lại công ty với giá 220 triệu đô la.

Sergey Brin, trong khi trượt pa-tanh khắp các hành lang của Gates Hall, đã lưu ý tới việc đó. Dù Brin và Page không học lớp của Cheriton, họ đã tới văn phòng của ông để xin lời khuyên. Cụ thể, họ muốn biết làm thế nào họ có thể khiến một công ty quan tâm tới việc sử dụng PageRank cho công nghệ tìm kiếm của nó. Cheriton nói với họ rằng việc đó sẽ khó khăn, ông nhắc họ nhớ rằng Sun Microsystems đã bắt đầu phải đối mặt với thất bại khi các công ty đều bác bỏ những nỗ lực nhằm bán công nghệ máy trạm của Bechtolsheim.

Tuy nhiên, tại thời điểm đó Brin và Page vẫn còn chần chừ chưa muốn tự mình thử sức. Họ đều nhắm tới Stanford với dự định trở thành tiến sĩ như những người cha của mình.

Nhưng xin cấp bằng cho công cụ tìm kiếm của họ không phải là dễ. Mặc dù Brin và Page có được một buổi họp tốt đẹp với những người sáng lập Yahoo, Jerry Yang và David Filo, đều là cựu sinh viên Stanford, Yahoo không thấy có nhu cầu mua công nghệ công cụ tìm kiếm. Họ cũng gặp gỡ cả một người thiết kế của AltaVista, người có vẻ quan tâm tới BackRub. Nhưng những người thông thái ở trụ sở của DEC ở Maynard, Massachusetts, cũng từ chối ý tưởng đó.

Có lẽ lần Page và Brin tiến gần tới thành công nhất là khi họ gặp gỡ Vinod Khosla, một quỹ mạo hiểm đã tài trợ cho Excite, một công ty tìm kiếm đã bắt đầu – cũng giống như Yahoo – với một đám những sinh viên sáng lán của Stanford. Terry Winograd, cố vấn của Sergey, đồng hành cùng họ tới buổi gặp này.

Việc này đã dẫn tới buổi họp với các nhà sáng lập Excite, Joe Kraus và Graham Spencer, tại Fuki Sushi, một nhà hàng ở Palo Alto. Những người của Excite bắt đầu các cuộc thử nghiệm so sánh với BackRub, đưa vào các lệnh tìm kiếm như “Bob Marley.” Các kết quả đều tốt hơn của Excite nhiều lần.

Larry Page vạch ra một kế hoạch tỉ mỉ, anh miêu tả chi tiết kế hoạch này trong các thư điện tử gửi Khosla tháng 1 năm 1997. Excite sẽ mua BackRub, sau đó một mình Larry sẽ tới đó làm việc. Việc Excite ứng dụng công nghệ BackRub, anh tuyên bố, sẽ làm tăng lượng truy cập lên 10%. Suy luận rằng do doanh thu từ quảng cáo tăng, Excite sẽ thu về thêm 130.000 đô la mỗi ngày, tổng số là 47 triệu đô la mỗi năm. Page hình dung nhiệm kỳ của mình ở Excite sẽ kéo dài 7 tháng, đủ lâu để giúp công ty vận hành công cụ tìm kiếm. Rồi sau đó anh sẽ rời đi, vào khoảng thời gian kỳ học mùa thu năm 1997 ở Stanford, khởi động lại quá trình làm tiến sĩ của mình. “Với sự giúp đỡ của tôi,” cậu sinh viên chưa tròn 24 tuổi viết, “công nghệ này sẽ mang lại cho Excite một lợi thế vững vàng và sẽ đẩy công ty lên vị trí dẫn đầu thị trường.”

Nhưng thương vụ không bao giờ xảy ra. Hassan nhớ lại buổi họp quyết định mà rất có thể nó đã nhấn chìm thương vụ đó. Khi nhóm tới văn phòng của Bell, vị CEO mới của Excite, một cựu lãnh đạo của tạp chí Time Mirror, họ khởi động BackRub trên một cửa sổ và Excite trên một cửa sổ khác để đọ sức trực tiếp.

Đề kiểm tra đầu tiên là lệnh tìm kiếm từ “Internet”. Theo lời Hassan, các kết quả đầu tiên của Excite là mấy trang web của Trung Quốc với từ tiếng Anh “Internet” đứng giữa một rừng những từ tiếng Trung. Rồi nhóm gõ “Internet” vào chương trình BackRub. Hai kết quả đầu tiên cho ra các trang hướng dẫn sử dụng các trình duyệt. Nó chính xác là loại kết quả hữu ích hẳn sẽ làm hài lòng hầu hết những người thực hiện lệnh tìm kiếm đó.

Bell thể hiện sự thất vọng rõ rệt. Sản phẩm của Stanford quá tốt. Nếu Excite làm chủ một công cụ tìm kiếm ngay lập tức đưa ra cho mọi người thông tin mà họ tìm kiếm, anh giải thích, người dùng sẽ rời site ngay lập tức. Bởi vì doanh thu quảng cáo của anh đến từ những người tiếp tục ở lại trên site – “bám trụ” là hệ số đo lường đáng ao ước nhất trên các website ở thời bấy giờ – sử dụng công nghệ của BackRub sẽ phản tác dụng. “Anh ấy nói với chúng tôi là anh ấy muốn công cụ tìm kiếm của Excite đạt được 80% chất lượng các công cụ tìm kiếm khác,” Hassan kể. Và phản ứng của chúng tôi là: “Ối chà, mấy gã này không biết họ đang nói về cái gì.”

Hassan kể anh đã giục Larry và Sergey rời Stanford và thành lập công ty ngay từ lúc đó, khoảng đầu năm 1997. “Những người khác đều đang làm như vậy,” anh nói. “Tôi thấy Hotmail và Nestcape hoạt động thực sự tốt. Tiền đang chảy về Thung lũng. Vậy nên tôi nói với họ: ‘Công cụ tìm kiếm là một ý tưởng. Chúng ta nên làm việc này’. Họ không nghĩ vậy. Larry và Sergey đều rất quả quyết rằng họ có thể xây dựng công cụ tìm kiếm này tại Stanford.”

“Chúng tôi không… có lối tư duy kiểu doanh nhân hồi đó,” về sau Sergey thú thực.

Hassan rời khỏi dự án. Anh nhận vào làm tại một công ty mới tên là Alexa và làm việc bán thời gian cho eGroups, một công ty khởi nghiệp, Larry và Sergey, dù vẫn gặp không ít khó khăn – đã hỗ trợ 5000 đô la mỗi người để giúp anh mua máy tính cho eGroups. (Khoản đầu tư đó sau chưa tới ba năm đã mang lại kết quả khi Yahoo mua lại eGroups với giá khoảng 413 triệu đô la.)

Nhưng trong một năm rưỡi sau đó, tất cả các công ty họ tiếp cận đều khiến họ thất vọng. Chỉ có rất ít người quan tâm nhưng cái giá họ đưa ra bị quá thấp. Do vậy, Page và Brin quyết định quay trở lại Stanford để nghiên cứu thêm về nó. Không phải là chúng tôi muốn nhiều tiền, nhưng chúng tôi muốn món đó thực sự được sử dụng. Và họ muốn chúng tôi làm việc ở đó, và chúng tôi hỏi, ‘Mình có thực sự muốn làm việc cho công ty đó không?’ Mấy công ty này sẽ không tập trung vào lĩnh vực tìm kiếm – họ sẽ trở thành các cổng giao dịch điện tử. Họ không hiểu gì về tìm kiếm, và họ không phải những con người công nghệ.”

Tháng 9 năm 1997, Page và Brin đặt lại tên cho BackRub. Họ muốn có một cái tên phù hợp với việc kinh doanh. Một người bạn cùng phòng ký túc với Page gợi ý cho họ gọi nó là “googol.” Đây là một thuật ngữ trong toán học, chỉ con số có số 1 đứng trước 100 số 0. Đôi khi từ “googolplex” cũng được sử dụng để chỉ một con số lớn khủng khiếp. “Cái tên phản ánh phạm vi của điều chúng tôi đang thực hiện,” vài năm sau Brin giải thích. “Càng về sau, nó càng thực sự là một lựa chọn tên tốt, bởi vì bây giờ chúng tôi có hàng triệu trang và ảnh cùng các nhóm, các tài liệu, cũng như hàng trăm triệu lượt tìm kiếm một ngày.” Page đánh vấn nhầm từ đó, điều này hóa ra lại cũng ổn vì địa chỉ Internet cho từ đánh vần đúng đã được sử dụng rồi. Còn tên “Google” thì chưa ai dùng. “Nó cũng dễ gõ và dễ nhớ,” Page nói.

Một đêm nọ, Sergey đã thiết kế trang chủ của Google bằng một chương trình đồ họa mã nguồn mở có tên là GIMP. Mỗi chữ cái trong tên của công ty được thiết kế một màu khác nhau, tạo thành một logo tương tự như cái gì đó được làm từ các khối hình của trẻ con. Nó truyền tải ý nghĩa của một sự ngẫu hứng đáng yêu. Anh đặt một dấu chấm than sau cái tên, giống như Yahoo, một công ty Internet khác được thành lập bởi hai vị tiến sĩ bỏ học của Stanford. “Cậu ấy muốn nó tươi vui và trẻ trung,” Page nói. Không giống nhiều trang web khác, trang chủ của Google sơ sài đến nỗi nó trông như là chưa được hoàn thành. Trang có một hộp để gõ các yêu cầu và hai nút bên dưới, một để tìm kiếm và một được gắn nhãn Xem trang đầu tiên tìm được, một cam kết tự tin gây sửng sốt ám chỉ rằng, không giống như các đối thủ khác, Google có khả năng đáp ứng chính xác nhu cầu của bạn ngay ở lần thử đầu tiên. (Có một lý do khác cho nút ấn đó. “Mục đích của Xem trang đầu tiên tìm được là để thay thế hệ thống tên miền dùng để định hướng,” Page giải thích năm 2002. Cả Page và Brin đều hy vọng rằng thay vì đoán xem địa chỉ của đích đến trên mạng của mình là gì, người ta sẽ đơn giản là “lên trang Google.”) Ngày hôm sau Brin chạy quanh bộ môn Khoa học máy tính của Stanford, khoe sản phẩm sáng tạo GIMP của mình. “Anh hỏi mọi người xem liệu có cần đưa thêm những thứ khác lên trang đó không,” một giảng viên của Stanford, Dennis Allison, kể lại. “Và tất cả mọi người đều trả lời không.” Với Page và Brin thì như thế là ổn. Càng nhiều thứ hiện trang, trang sẽ chạy càng chậm hơn. Và cả hai người bọn họ, đặc biệt là Page, đều tin rằng tốc độ là điều tối quan trọng để làm hài lòng người sử dụng. Sau này Page phát hiện ra một điều rất khôi hài, đó là mọi người ca ngợi thiết kế đó vì việc sử dụng không gian màu trắng rất mang hơi hướng Thiền. “Trường phái nghệ thuật tối hiểu12 là do chúng tôi không có một người quản trị mạng và phải tự mình làm lấy,” anh giải thích.

Trong khi đó, BackRub-đổi thành – Google đã phát triển tới mức các phương tiện ở Stanford không còn đáp ứng được nhu cầu vận hành của nó. Nó không còn giống một dự án về hoạt động tìm kiếm nữa mà ngày càng giống một công ty khởi nghiệp hoạt động từ một trường đại học tư. Sự chần chừ của Page và Brin đối với việc viết một bài báo về công việc của họ đã trở thành “tiếng xấu đồn xa” trong khắp bộ môn. “Mọi người kháo nhau: ‘Sao việc này lại bí mật quá vậy? Đây là một dự án mang tính hàn lâm, chúng ta nên biết nó làm việc thế nào chứ,’” Terry Winograd kể.

Có vẻ như Page khá mâu thuẫn về vấn đề thông tin. Một mặt, anh toàn tâm tin tưởng vào triết lý chia sẻ kiến thức của hacker. Đó cũng là một phần mục đích chính của dự án này: Khiến cho tri thức nhân loại dễ tiếp cận hơn, khiến cho thế giới trở nên tốt đẹp hơn. Nhưng đồng thời anh cũng có ý thức mạnh mẽ về việc bảo vệ thông tin độc quyền mà khó khăn lắm anh mới giành được.

Nhưng vấn đề ngăn trở Brin và Page không chỉ có sự kín đáo. Việc viết một bài báo đối với họ không thú vị bằng việc tạo dựng một cái gì đó. “Vốn dĩ, Larry và Sergey không có thiên hướng viết lách – họ thiên về sản phẩm,” Winograd nhận xét. “Nếu có thêm 10 phút, họ sẽ muốn cải thiện cái gì đó. Họ không muốn dùng 10 phút đó để nói với bạn về những gì họ đã làm.” Nhưng cuối cùng Winograd cũng thuyết phục được họ giải thích về PageRank trên một diễn đàn chung. Họ giới thiệu một bài báo có tựa đề. “Mổ sẻ một Công cụ Tìm kiếm web Siêu văn bản với phạm vi rộng” (The Anatomy of Large – Scale Hypertextual Web Search Engine) tại một hội thảo ở Úc tháng 5 năm 1998.

Có lần Arthur Clarke13 nhấn mạnh rằng công nghệ tốt nhất không khác phép thuật là mấy. Và chương trình tìm kiếm Google quả thật giống với phép màu. Ở Stanford, giáo viên và bạn bè của Larry và Sergey đã sử dụng công cụ tìm kiếm để trả lời các câu hỏi và nói cho bạn bè mình về điều đó. Google thực hiện khoảng 10.000 câu hỏi một ngày. Có những lúc, nó chiếm đến một nửa công suất Internet của Stanford. Cơm thèm thiết bị và băng thông rộng của nó ngày càng mãnh liệt. “Chúng tôi cầu xin và vay mượn,” Page kể. “Có hàng tấn máy tính xung quanh, và chúng tôi xoay sở để có được vài chiếc.” Phòng ký túc của Page, về bản chất, là trung tâm hoạt động của Google, với một mớ hỗn độn các loại máy vi tính từ các nhà sản xuất khác nhau, nhồi nhét trong một phiên bản giá đặt máy chủ tự làm – một khoang chứa lắp ghép. Larry và Sergey thường lang thang quanh bãi đỗ để xem ai trong trường sắp nhận được máy – các công ty như Intel và Sun cho Stanford rất nhiều máy móc miễn phí để dụ dỗ các nhân viên tương lai – và rồi cặp đôi này sẽ hỏi những người được nhận máy xem họ có thể chia sẻ tí chút phần thưởng đó được không.

Như thế vẫn chưa đủ. Để lưu được hàng triệu trang họ đã mày mò được, cặp đôi đã phải tự mua các ổ đĩa có dung lượng lớn. Page, người có biệt tài tận dụng từng xu, đã tìm được một nơi bán đĩa được tân trang lại với giá rẻ – bằng 1/10 giá gốc – đến nỗi rõ ràng là phải có vấn đề gì đó với mấy cái đĩa này. “Tôi tìm hiểu và phát hiện ra rằng chất lượng của chúng sẽ ổn miễn là bạn thay thế hệ thống hoạt động [của đĩa],” anh kể. “Chúng tôi có 120 ổ, mỗi ổ khoảng 9 GB. Tức là có khoảng 1 TB14 chỗ chứa.” Đó là phương pháp mà sau này Google ứng dụng để xây dựng cơ sở hạ tầng với chi phí thấp.

Larry và Sergey sẽ ngồi trước màn hình, quan sát các lệnh tìm kiếm – và những lúc cao điểm nhất thì mỗi giây lại có thêm một lệnh mới – và rõ ràng là họ cần thêm thiết bị. Tiếp theo sẽ là gì? họ tự hỏi.

Stanford không bắt họ phải rời đi – sự rắc rối của việc vận hành một Google mới mọc ra được bù đắp bằng niềm tự hào rằng một điều thật thú vị đang hình thành trong bộ môn. “Không phải là ánh hào quang của chúng tôi bị lu mờ đi khi họ vận hành bọ tìm kiếm,” Garcia-Monlina, người vẫn hy vọng rằng Larry và Sergey sẽ phát triển công trình của mình theo hướng hàn lâm, nói, “Tôi nghĩ nó sẽ tạo thành một lý thuyết vĩ đại,” ông nói. “Tôi nghĩ gia đình họ cũng ủng hộ họ lấy bằng tiến sĩ. Nhưng thành lập một công ty thì lại là một sự hấp dẫn khó lòng cự tuyệt.”

Không có phương án nào khác; không ai trả đủ cho Google. Và những vị khách hạnh phúc đã bị họ hấp dẫn đã giúp họ thấy tự tin rằng những nỗ lực của mình sẽ tạo nên sự khác biệt. Sau nhiều năm mơ mộng về việc làm sao những ý tưởng của mình có thể thay đổi thế giới, Larry Page nhận ra rằng anh đã làm được một vài việc có thể tạo ra những thay đổi đó. “Nếu công ty thất bại, quá tệ,” Page nói. “Chúng tôi thực sự sẽ làm được điều gì đó thực sự có ý nghĩa.”

Họ quay lại với Dave Cheriton, người khuyến khích họ vào cuộc. “Tiền không nên là vấn đề,” anh nói. Cheriton gợi ý rằng họ nên gặp Andy Bechtolsheim. Brin thảo nhanh một bức thư điện tử cho Bechtocheim, gửi vào khoảng nửa đêm hôm đó và ngay lập tức nhận được thư hồi đáp hỏi xem hai cậu sinh viên có thể có mặt lúc 8 giờ sáng hôm sau tại nhà của Cheriton được không, Bechtolsheim vẫn thường đi làm vào giờ đó mỗi ngày. Vào cái giờ phiền phức đó, Page và Brin chạy thử công cụ tìm kiếm của mình cho Bechtolsheim xem trên hiên nhà Cheriton, ở đó có cổng kết nối mạng. Bechtolsheim, ấn tượng nhưng còn vội đi làm, nhanh chóng dừng cuộc gặp bằng cách đưa ra đề nghị viết một tấm séc trị giá 100.000 đô la cho bộ đôi.

“Chúng tôi chưa có tài khoản ngân hàng,” Brin nói.

“Gửi vào lúc nào các anh có,” Bechtolsheim nói, lao vội vào chiếc Porsche. Với một hành động đơn giản như thể đang quơ nhanh một ly cà phê sữa trên đường đi làm, ông vừa tạo ra một doanh nghiệp sẽ thay đổi cách cả thế giới tiếp cận thông tin. Brin và Page ăn mừng bằng một bữa sáng tại Burger King. Tấm séc nằm lại trong phòng ký túc của Page một tháng trời.

Không lâu sau đó, những nhà đầu tư cá nhân khác đã cùng tham gia với Bechtolsheim, trong đó có Dave Cheriton. Một người nữa là doanh nhân của Thung lũng Silicon tên là Ram Shriram, công ty của ông này khi đó mới được Amazon.com mua lại. Shriram đã gặp Brin và Page hồi tháng 2 năm 1998; mặc dù không thực sự tin tưởng vào mô hình kinh doanh công cụ tìm kiếm, ông đã ấn tượng với Google đến mức không ngừng quảng cáo về nó. Sau cuộc gặp gỡ với Bechtolsheim, Shriram mời họ tới nhà mình để gặp cấp trên của ông, Jeff Bezos, người đã bị mê hoặc trước đam mê của họ cũng như “sự bướng bỉnh lành mạnh” khi họ giải thích vì sao họ sẽ không bao giờ đặt các quảng cáo nổi bật trên trang chủ của mình. Bezos tham gia cùng Bechtolsheim, Cheriton và Shriram với tư cách nhà đầu tư, góp thành tổng cộng một triệu đô la tiền vốn.

Ngày 4 tháng 9 năm 1998, Page và Brin nộp đơn thành lập công ty và cuối cùng cũng chuyển khỏi khuôn viên trường. Bạn gái của Sergey lúc đó khá thân thiết với một người quản lý của Intel tên là Susan Wojcicki, Susan cùng chồng vừa mua một ngôi nhà trên đường Santa Margarita trên Đại lộ Menlo với giá 615.000 đô la. Để kiếm tiền trả góp, đôi vợ chồng cho Google thuê lại gara và vài căn phòng trong nhà với giá 1.700 đô la một tháng. Đó là thời điểm họ thuê nhân sự đầu tiên, một sinh viên cùng trường Stanford, Craig Silverstein. Anh tạo được mối dây liên kết với họ là nhờ việc hứa hẹn sẽ chỉ cho họ cách nén tất cả các đường dẫn mà họ đã tìm được để chúng có thể được lưu vào bộ nhớ và chạy nhanh hơn (“Chủ yếu là để tôi đặt được chân qua ngưỡng cửa”, anh kể lại.) Họ cũng thuê một quản lý văn phòng đồng thời duy trì sự có mặt tại trường Stanford mùa thu năm ấy, cùng dạy một khóa học, CS 349, “Tìm kiếm dữ liệu, Tìm kiếm và Mạng toàn cầu,” lớp này học 2 buổi một tuần vào học kỳ đó. Brin và Page loan tin về khóa học đó là một “lớp học dự án” mà trong đó các sinh viên sẽ làm việc với một kho chứa 25 nghìn trang web mà họ đã thu thập được. Họ thậm chí còn có cả một trợ lý nghiên cứu. Bài đọc được giao về đầu tiên chính là bài báo của họ, nhưng đến giai đoạn sau của học kỳ thì lớp học lại rất sốt sắng với việc so sánh giữa PageRank và công trình của Kleinberg.

Tháng 12, sau khi những dự án cuối cùng được hoàn thành, Page gửi thư mời dự tiệc cho các sinh viên, bức thư đó cũng đã ghi lại một dấu mốc: “Dự án Nghiên cứu Stanford bây giờ là Google.com: Công ty Tìm kiếm Internet Thế hệ Mới (The Next Greration Internet Search Company.”

“Trang phục thì theo phong cách đồ mặc ở nhà,” thư mời nói rõ, “và nhớ mang tới cái gì đó để xài với bồn tắm nước nóng.”

2“CHÚNG TÔI MUỐN GOOGLE THÔNG MINH ĐƯỢC NHƯ BẠN.”

Larry Page không muốn kết thúc như Tesla. Google đã nhanh chóng trở thành chương trình yêu thích của tất cả những ai sử dụng nó để tìm kiếm trên mạng. Nhưng ban đầu thì Alta Vista cũng thế và công cụ tìm kiếm đó đã không phát triển thành công. Vậy thì Google, dưới sự dẫn dắt của hai cậu trai trẻ tài năng năng thiếu kinh nghiệm, sẽ xoay sở thế nào trước những vấn đề vô cùng khó nhằn để cải thiện dịch vụ của mình đây?

“Nếu năm sau mà chúng tôi không tốt hơn hẳn, chắc chắn chúng tôi sẽ rơi vào quên lãng,” Page nói với một trong những phóng viên đầu tiên đến thăm công ty.

Mạng lan nhanh như sắn dây. Người ta đua nhau vào Google. Kế hoạch của Google là tăng lưu lượng truy cập vào webstie hơn nữa. “Khi bắt đầu công ty, chúng tôi có hai chiếc máy tính,” Craig Silvestein kể. “Một chiếc là dịch vụ mạng, chiếc kia làm tất cả những việc còn lại – xếp hạng trang, tìm kiếm. Và đằng sau máy tính là cả một chuỗi dài bất tận những chiếc đĩa lưu trữ đến 25 triệu trang web. Rõ ràng là như vậy thì không được cân bằng lắm.” Kiếm thêm máy tính không phải vấn đề. Google cần sức mạnh tư duy, nhất là vì Brin và Page đã chạm ngưỡng giới hạn của mình trong việc viết phần mềm cho phép công cụ tìm kiếm phát triển và đi lên. “Mã hóa không phải là lĩnh vực yêu thích của họ,” Silverstein nói.

Các nhà sáng lập cũng biết rằng Google phải thông minh hơn rất nhiều mới có thể tiếp tục làm hài lòng người dùng – cũng như để thỏa mãn tham vọng thay đổi thế giới của họ. “Chúng tôi không phải lúc nào cũng làm ra những thứ mọi người muốn,” Page giải thích trong những ngày đầu tiên của Google. “Như thế rất khó. Để làm được điều đó bạn phải thật thông minh – bạn phải hiểu tất cả mọi điều trên thế giới. Trong khoa học máy tính, chúng tôi gọi đó là trí thông minh

nhân tạo.”

Brin hùa vào. “Chúng tôi muốn Google phải thông minh như bạn – bạn nên có được câu trả lời ngay vào giây phút bạn nghĩ ra câu hỏi.”

“Một công cụ tìm kiếm tốt nhất, tân tiến nhất,” Page nói. “Chúng tôi còn cách nó một quãng xa.”

Page và Brin đều giữ một niềm tin cốt lõi là thành công của công ty họ phụ thuộc hoàn toàn vào việc có được các kỹ sư và nhà khoa học tầm cỡ thế giới nguyện cống hiến cho tầm nhìn đầy tham vọng của họ. Page tin rằng các công ty công nghệ chỉ có thể vươn lên nhờ “một hiểu biết ở tầm cao nhất về khoa học công nghệ.” Bằng cách nào đó, Page và Brin phải tìm ra được một nhóm như vậy và tạo đủ ấn tượng để họ muốn tham gia vào một công ty khởi nghiệp nhỏ bé. Ồ, và họ có một chính sách giúp thu hẹp phạm vi: Không có những người khó chịu. Họ đã nghĩ ngay đến văn hóa công ty mình và đảm bảo rằng những người họ tuyển sẽ thể hiện những phẩm chất như thông minh sắc sảo, hướng tới người dùng và sáng ngời lý tưởng.

“Chúng tôi chỉ tuyển những người giống mình,” Page nói.

Một số nhân viên ban đầu của Google chỉ là các sinh viên sắp tốt nghiệp có tài, những người như Marissa Mayer, một thiên tài toán học cần cù và một vũ công ba-lê tại trường trung học của cô ở Wausau, Wisconsin, người đã trở thành một ngôi sao trí thông minh nhân tạo của Stanford. (Trong buổi phỏng vấn của cô với Silverstein, cô được hỏi về ba điều mà Google có thể làm tốt hơn; 10 năm sau, cô vẫn còn giận mình vì chỉ liệt kê được ra có hai điều.) Nhưng Page và Brin còn theo đuổi cả những người có hồ sơ hay xuất hiện ở các văn phòng tuyển dụng của Microsoft Research hay bộ môn Khoa học máy tính của Carnegie Mellon nữa. Một trong những phi vụ táo bạo đầu tiên của họ là với một vị giáo sư của Đại học California ở Santa Barbara tên là Urs Hölzle. Ông đã từng tìm hiểu loạt công cụ tìm kiếm trước đó như Alta Vista và Inktomi để rồi kết luận rằng, với tư cách là một nhà khoa học máy tính đã quen thuộc với ngôn ngữ lập trình Boolean và các kỹ thuật khác, ông có thể sử dụng các kỹ thuật này để tìm được những gì mình muốn trên mạng. Nhưng mẹ ông thì không bao giờ có thể sử dụng được các kỹ thuật này. Google ngay lập tức thay đổi cách nghĩ của ông về việc đó: Bạn chỉ cần gõ điều bạn muốn vào máy và, bùm, kết quả đầu tiên đã hợp lý rồi. Mẹ sẽ thích điều này lắm! “Dường như họ biết chắc chắn là mình đang làm gì,” ông nói về Larry và Page.

Quan trọng hơn, khi tới thăm công ty mới vào đầu năm 1999, ông đã hiểu ra rằng dù mình không có chút nền tảng nào trong lĩnh vực tìm kiếm thông tin nhưng những vấn đề mà Brin và Page đang tìm cách giải quyết có rất nhiều điểm chung với công việc của ông trong những hệ thống máy tính lớn. Công cụ tìm kiếm nhỏ xinh này đang lao vào những vấn đề về hiệu quả hoạt động và tính khả mở (khả năng nâng cao năng lực tính toán cho máy tính) mà trước đây chỉ có các dự án lớn mới dám thử. Đó chính là vũ khí bí mật của Google để lôi kéo các nhà khoa học máy tính tầm cỡ thế giới: Trong một thế giới nơi các phòng thí nghiệm của doanh nghiệp đang dần đóng cửa, công ty khởi nghiệp nhỏ bé này đưa ra một cơ hội để tạo nên những đột phá trong ngành khoa học máy tính.

Hölzle, rất thận trọng, chấp nhận lời đề nghị nhưng vẫn giữ vị trí của mình tại UCSB bằng cách xin tạm nghỉ một năm. Ông không bao giờ trở lại. Tháng Tư, ông tới Google cùng Yoshka, một chú chó Leonberger lông xù, lẽo đẽo theo sau. Ông ngay lập tức ngụp lặn để giúp vượt qua tình trạng hạ tầng bị quá tải. (Tới lúc đó, Google đã chuyển khỏi ngôi nhà Wojcicki ở khu Công viên Menlo tới một văn phòng hai tầng phía trên một cửa hàng xe đạp ở trung tâm Palo Alto.) Mặc dù lúc này Google đã có trong tay một trăm máy tính – công ty mua máy nhanh hết sức có thể – nó chưa thể giải quyết được khối lượng các lệnh tìm kiếm. Có đến hàng trăm nghìn lệnh một ngày được nhập vào hệ thống.

Thời gian tìm kiếm trung bình tại thời điểm đó, Hölzle nhớ lại, mất khoảng ba giây rưỡi. Vì tốc độ là một trong số các giá trị cốt lõi của Page và Brin nên đây chính là nguồn gốc đau khổ cho những người sáng lập. “Về cơ bản, chúng tôi đã hoạt động hết công suất trong những giai đoạn cao điểm của mỗi ngày,” Hölzle nói. “Không có vấn đề gì xảy ra đối với người sử dụng. Vấn đề nằm ở khả năng tăng trưởng, các cải tiến hoạt động.” Vấn đề này có một phần là do Page và Brin đã viết (viết mã nguồn) hệ thống bằng thứ mà Hölzle gọi là “mã đại học”, một cách văn hoa khi nói về những tay nghiệp dư. “Máy chủ không thể xử lý nhiều hơn 10 yêu cầu (request) hoặc hơn trong một giây vì nó được viết bằng Python, một ý tưởng tuyệt vời đối với một hệ thống dùng để nghiên cứu nhưng không phải là một giải pháp có hiệu suất cao,” ông nói. Ông ngay lập tức sắp xếp để viết lại chỗ mã đó.

Cùng làm với việc Hölzle còn có một số nhà khoa học máy tính khác, những người táo bạo hơn trong việc quyết định trở thành nhân viên chính thức của Google. Trong số này có cả các kỹ sư từ bộ phận nghiên cứu của DEC. Huyền thoại bắt đầu từ Thung lũng Silicon với cái tên Trung tâm nghiên cứu Paolo Alto (PARC) thuộc Xerox, một phòng nghiên cứu kinh điển đầy ắp sự đổi mới mang tính đột phá, nhưng lại bị hiểu nhầm, chôn vùi hoặc nói cách khác bị hủy hoại bởi công ty mẹ thiếu hiểu biết. (Các phát minh của nó bao gồm cả giao diện máy tính hiện đại với các cửa sổ (window) và các thư mục chứa tập tin (file folder). Nhưng sau khi các cơ hội bị bỏ lỡ, PARC chẳng còn lại gì tại Phòng nghiên cứu Phía Tây của DEC, nơi này về sau bị chuyển cho Compaq khi công ty máy tính cá nhân đó mua lại Digital Equipment Corporation năm 1998. (Năm 2002, Hewwlett-Packard mua lại Compaq). Trong năm 1998, hai năm trước khi Apple bắt đầu nghiên cứu iPod, các kỹ sư của DEC lúc đó đã đang phát triển một máy nghe nhạc điện tử có thể chứa nguyên một bộ sưu tập âm nhạc và có kích thước vừa với túi của bạn. Hơn nữa, DEC còn có một vài cha đẻ của Internet, cũng như các nhà khoa học viết những bản nghiên cứu đầu tiên về học thuyết mạng. Nhưng DEC chưa bao giờ sử dụng ý tưởng đến từ các kỹ sư của mình để giúp phát triển Alta Vista trở thành Google. (“Từ khoảnh khắc tôi rời khỏi DEC, tôi không bao giờ sử dụng lại AltaVista,” Louis Monier, người đã rời đi năm 1998, nói. “Nó đơn giản là thảm hại. Hoàn toàn hiển nhiên là Google tốt hơn”). Nên gần như chả có gì phải băn khoăn khi một vài người trong số họ đến với Google. “Số lượng [các cựu chuyên gia của DEC làm việc tại Google] thật sự là thứ có thể gây choáng,” Bill Weihl, một người tị nạn từ DEC chuyển đến công ty này năm 2004.

Một trong số các kỹ sư DEC đó đã độc lập khám phá ra sức mạnh của các kết nối web trong tìm kiếm. Jeffray Dean băn khoăn không biết liệu việc một chương trình phần mềm có thể hướng người sử dụng web đến các trang có liên quan đến những thứ mà họ thích. Theo cách nhìn của ông, bạn sẽ đọc một bài báo trên The New York Times và chương trình của ông sẽ nhảy ra (pop-up) và hỏi bạn có muốn xem mười trang hay ho khác có liên quan đến nội dung mà bạn đang đọc không.

Tháng Hai năm 1999, Dean đã rời DEC để gia nhập một công ty mới khởi nghiệp có tên là mySimon.

Dù vậy, trong vài tháng, ông thấy buồn chán. Sau đó ông biết được rằng Urs Hölzle, đã gia nhập nhóm những người làm ra PageRank. “Tôi đã tính toán rằng Google hẳn sẽ là một lựa chọn tốt hơn vì tôi biết nhiều người ở đó hơn và họ có vẻ như là am hiểu kỹ thuật hơn,” ông nói. Ông đã phấn khích đến nỗi mà mặc dù thời gian chính thức bắt đầu của ông là tháng Tám năm 1999, từ tháng Bảy, ông đã bắt đầu đến Google sau khi kết thúc công việc hàng ngày tại mySimon.

Bộ phận tuyển dụng của Dean bắt đầu chú ý tới một nhà nghiên cứu khác của DEC, Krishna Bharat. Anh ta cũng từng suy nghĩ về các cách thức nhận kết quả tìm kiếm web từ các kết nối. Bharat lúc đó đang nghiên cứu một thuật toán có tên là Hilltop, nó xác định theo thuật toán các “expert sites” (trang chuyên nghiệp) và sử dụng chúng để trỏ đến các kết quả chính xác nhất bằng cách đi thẳng đến đại diện của website đó – các kết nối và một số bit từ các trang con – được lưu trữ trên bộ nhớ máy tính. Các thuật toán của Bharat sẽ đi loanh quanh “họ hàng của truy vấn này” để tìm ra các trang quan trọng.

Nhà khoa học máy tính sinh tại Ấn Độ này đã nằm trong tầm ngắm của Google: Khi ăn trưa tại một hàng rong có tên là World Wraps tại Palo Alto, anh ta gặp Sergey Bin, người như thường lệ sẽ đưa cho anh ta một danh thiếp thương mại và thôi thúc anh xin tuyển vào Google. Bharat có ấn tượng với Google. Nhưng Google quá nhỏ. Rất khó để Bharat nghĩ đến việc rời khỏi những điều kiện tiện nghi của một công ty lớn để đến một công ty nhỏ với lực lượng lao động có một chữ số như Google. Hơn nữa, anh ta ấp ủ khả năng theo đuổi việc nghiên cứu, điều mà anh ta không biết liệu có thể thực hiện được ở một công ty mới khởi nghiệp này không.

Sau đó Google đã thuê Jeff Dean, và Bharat đã bị choáng. Nó giống như việc một đội bóng rổ chơi ở một giải đấu nhỏ ít người biết kiếm được một cầu thủ thuộc loại hàng đầu ở NBA15. Những anh chàng đó hoàn toàn nghiêm túc. Rất nhanh sau đó, Bharat biết được rằng cái công ty khởi nghiệp mới thành lập này, thậm chí còn khó có thể đáp ứng được lưu lượng truy vấn của nó, đang bắt đầu hình thành một nhóm nghiên cứu! Nghe giống như một câu chuyện hoang đường, nhưng Bharat quyết định tham gia phỏng vấn. Anh nói thẳng quan điểm rằng mình không tin lắm vào sự thành công của các tham vọng nghiên cứu của Google. “Larry, tại sao cậu lại nói rằng cậu muốn làm nghiên cứu?” anh ta hỏi Page. “Cậu giống như một tập hợp nhỏ xíu!” Câu trả lời của Page bất ngờ và ấn tượng. Nhìn sự việc từ một góc độ khác có thể dẫn đến những giải pháp không ngờ tới, Page nói. Trong kỹ thuật, đôi khi bạn nhìn mọi thứ với tầm nhìn kiểu đường hầm và cần một góc nhìn rộng lớn hơn. Anh ta kể cho Bharat câu chuyện về việc một nhân viên thuộc bộ phận nghiên cứu của hãng Kodak đã bất ngờ can thiệp và giúp hãng giải quyết được một vấn đề có vẻ như khó chữa như thế nào. Page muốn sự việc kiểu đó xảy tại Google.

Tác động đó đã bán đứng Bharat. Một chàng trai trẻ, thiếu kinh nghiệm sống, và hơi nhút nhát – nhưng hiểu sâu về kỹ thuật và rất tự tin. “Tôi có thể tôn trọng Larry theo cách mà tôi không thể dùng để tôn trọng những người điều hành các công ty khởi nghiệp khác”, Bharat nói. “Tôi biết nội dung kỹ thuật trong công việc của anh ta”. Hơn nữa, Bharat có thể cảm thấy sức hút trong chiến dịch nhằm làm thế giới tốt đẹp hơn bằng cách đập vỡ các vấn đề khó khăn tại giao điểm của khoa học máy tính và trừu tượng của Page. Bharat đã nghĩ nhiều về nghiên cứu và say mê với các bí ẩn của nó. Nếu nhìn từ bên ngoài, mọi thứ có vẻ dễ dàng đến trêu ngươi. Nhưng mọi người chỉ nắm được phần nhỏ nhất về khả năng của nó. Để có thể tiến bộ, thậm chí sống trong không gian này, bạn sẽ phải sống trong dữ liệu đó, hít thở chúng như cá thải nước qua mang. Đây là lời mời của anh ta. Bharat cuối cùng sẽ làm một cuộc cách mạng cho thuật toán Hilltop của mình, được gọi là phân tích tính kết nối của web, trong bộ máy tìm kiếm của Google. Nó sẽ là bằng sáng chế đầu tiên của công ty này.

Lần tuyển dụng ấn tượng tiếp theo của Google vào đầu năm 2000: Anurag Acharya, một chuyên gia ở Santa Barbara, từng là đồng nghiệp của Hölzle. Acharya, từng nhận bằng Tiến sĩ tại Đại học Carnegie Mellon, dành cả đời mình trong giới học viện, nhưng ở tuổi ba mươi sáu anh bắt đầu đặt dấu hỏi về sự tồn tại của mình ở đó. Anh mệt mỏi với thứ công việc lệ thường mà ở đó mọi người tiếp nhận một vấn đề có tầm nhìn hạn chế, xử lý nó, báo cáo kết quả, và sau đó lại tiếp tục với một vấn đề khác. Anh nhớ lại khi còn là sinh viên và ngồi nói chuyện với người tư vấn của mình, một nhà tư tưởng sâu sắc đã dành cả cuộc đời để vật lộn với một bí mật to lớn duy nhất: Bản chất của ý thức là gì? Dần dần, Acharya cho rằng việc vật lộn với một vấn đề cổ điển khó nhằn mà nó sẽ vẫn tồn tại sau khi bạn rời khỏi trái đất là một việc rất hấp dẫn. Nói chuyện với Hölzle trong suốt cuộc phỏng vấn vào công ty nhỏ bé này, anh nhận ra nghiên cứu chính là loại vấn đề như thế. “Tôi không có kinh nghiệm trong nghiên cứu nhưng đang tìm kiếm một vấn đề đại loại như thế,” anh nói. “Có lẽ đây chính là vấn đề tôi đang tìm kiếm.” Thêm một điểm hấp dẫn với Google chính là nguồn gốc của anh – giống như nhiều đồng nghiệp mới khác của mình, anh ta đến từ một tỉnh của Ấn Độ. (Và giống như nhiều người khác tại Google, bao gồm cả những người sáng lập, bố mẹ anh ta đều là học giả). Anh thường nghĩ đến mọi người ở quê nhà, những người không chỉ nghèo khó mà còn thiếu thốn thông tin. “Nếu bạn thành công tại Google, mọi người ở bất kỳ đâu đều có thể tìm kiếm thông tin,” anh nói.

Bharat đề cử một người bạn khác là Ben Gomes, làm việc tại Sun. Gomes gia nhập Google cùng một tuần với Bharat. Và Bharat có một người bạn khác, một trong số những phi vụ thâu tóm có chất lượng nhất từng có: Amit Singhal.

Singhal sinh ra tại Ấn Độ. Năm 1992, anh sang Hoa Kỳ để theo đuổi bằng thạc sĩ về khoa học máy tính tại trường Đại học Minnesota. Anh bắt đầu hứng thú với một lĩnh vực có tên là thu thập thông tin và khao khát được nghiên cứu cùng với người tiên phong sáng tạo ra lĩnh vực đó, Gerard Salton. “Tôi chỉ nộp đơn vào một trường, và đó là Cornell,” anh nói. “Và tôi từng viết trong phần khai lý do của mình rằng nếu tôi có được Bằng Tiến sĩ, đó sẽ là cùng với Gerry Salton. Nếu không, tôi nghĩ Bằng Tiến sĩ không có giá trị gì.” Anh trở thành trợ lý của Salton, nhận được bằng Tiến sĩ tại Cornell, và cuối cùng thích thú với Phòng thí nghiệm AT&T.

Năm 1999, Singhal tình cờ gặp Bhaarat trong buổi hội thảo tại Berkeley. Bhrat nói rằng anh ta có ý định rời DEC để đến một công ty mới khởi nghiệp hay ho đang có tham vọng xử lý các vấn đề lớn nhất trong nghiên cứu. Công ty đó có cái tên vui nhộn, Google. Singhal cũng nên tới đó làm việc. Singhal đã nghĩ ý tưởng đó thật hài hước. Có lẽ nó phù hợp với Bharat, một người trẻ hơn anh vài tuổi và chưa lập gia đình.

Nhưng Singhal đã có vợ và con gái, vợ anh lại đang mang bầu đứa thứ hai. “Những công ty nhỏ này sẽ chẳng đi đến đâu cả,” anh ta nói. “Tôi làm việc cho AT&T—Con tàu lớn này luôn ra khơi. Tôi không thể chuyển đến cái công ty Google gì gì đó vì tôi còn phải nuôi gia đình.”

Không lâu sau đó, con tàu lớn AT&T bắt đầu đắm. “Năm 2000, tôi đã đến đây”, Singhal nói.

Gần một năm kể từ khi Brin và Page thành lập công ty của mình, họ đã tập hợp một nhóm các nhà khoa học hàng đầu, hoàn toàn ủng hộ tầm nhìn của những người sáng lập. Những nhân viên ban đầu này sẽ là một phần trong các nỗ lực của đội, liên tiếp đưa ra các sáng kiến, thứ mở rộng đường để Google vượt lên trên các đối thủ của nó và trở thành một từ đồng nghĩa với tìm kiếm. Nhưng những đột phá đó là tương lai sau này. Năm 2000, những bộ não lớn đó đã tập trung trong một phòng hội thảo để xử lý khẩn cấp một vấn đề về cơ sở hạ tầng. Google gặp tình huống xấu.

Vấn đề nằm ở chỉ mục lưu trữ các nội dung thuộc về trực tuyến trên các server của Google. Trong vài tháng đầu năm 2000, nó không cập nhật chút nào. Hàng triệu tài liệu được tạo trong thời gian đó đã không được thu thập. Đối với công cụ tìm kiếm Google, chúng không tồn tại.

Vấn đề nằm ở một lỗi trong tiến trình thu thập (crawling) và lập chỉ mục (indexing). Nếu một trong các máy dùng cho việc thu thập bị hỏng trước khi quá trình được hoàn thành, việc lập chỉ mục phải bắt đầu lại từ đầu. Nó giống như một trò chơi nhập vai trên máy tính mà bạn phải dành hàng trăm giờ để xây dựng một nhân vật và rồi toàn bộ công sức của bạn sẽ thành công cốc nếu nhân vật của bạn bị hạ bởi một con thú lạc hoặc kẻ thù có vũ trang. Thế giới trò chơi đã học được cách giải quyết vấn đề này – các hình đại diện đã chết có thể được hồi sinh sau một khoảng ngừng ngắn hoặc một lần chuyển chỗ phiền hà. Nhưng Google thì chưa.

Lỗi đó không ảnh hưởng nhiều lắm trong những ngày đầu của Google, khi họ chỉ cần dùng khoảng 5 máy cho việc thu thập và lập chỉ mục mạng.

Tuy nhiên, khi mạng tiếp tục phát triển, Google bổ sung thêm máy móc – vào thời điểm cuối năm 1999, có 80 máy tham gia việc thu thập (trong tổng số khoảng 3.000 máy tính thuộc sở hữu của Google vào thời điểm đó) – và khả năng xảy ra rủi ro tăng lên đáng kể. Đặc biệt kể từ khi Google coi việc mua những thứ thiết bị bị coi là “rẻ tiền” là cần thiết. Thay vì các thiết bị có tính thương mại được xử lý cẩn thận và đã được kiểm duyệt thông tin, Google sẽ mua các mẫu hàng tiêu dùng được giảm giá và chưa được lắp ráp để bảo vệ tính toàn vẹn của dữ liệu.

Về phần giải pháp tạm thời, các kỹ sư triển khai sắp xếp để dữ liệu chỉ mục được lưu trữ trên các ổ cứng khác nhau. Nếu một máy không ổn, máy nhắn tin của mọi người sẽ vang lên, thậm chí là vào nửa đêm và họ sẽ đổ xô vào phòng làm việc đó để ngay lập tức dừng việc thu thập, sao chép lại dữ liệu, và thay đổi các file cấu hình. “Cứ vài ngày, việc này lại xảy ra một lần, và về cơ bản thì nó dừng mọi thứ lại, rất tốn sức”, Sanjay Ghemawat, một trong số các thầy phù thủy nghiên cứu của DEC đã gia nhập Google, nói.

“Chúng ta cần xem xét lại toàn bộ,” Jeff Dean nói.

Thực tế là cần phải làm lại, vì từ năm 2000, các yếu tố cản trở việc thu thập phiền hà đến mức mà dù đã rất nỗ lực nhưng có vẻ như Google sẽ không bao giờ xây dựng được chỉ mục tiếp theo của nó. Mạng phát triển với tốc độ đáng kinh ngạc, với hàng tỷ tài liệu tăng lên mỗi năm. Sự xuất hiện của một công cụ tìm kiếm như Google thực tế đã thúc đẩy tốc độ này, khích lệ mọi người rất nhiều khi họ khám phá ra rằng thậm chí mẩu thông tin khó tìm nhất có cũng có thể tiếp cận bởi một lượng nhỏ những người đánh giá cao nó. Google đang cố gắng đón cơn sóng thần này bằng cách trang bị nhiều máy hơn – những máy móc rẻ tiền, do đó gia tăng khả năng bị hỏng. Các cập nhật sẽ có tác dụng trong một thời gian ngắn, sau đó bị lỗi. Và bây giờ, rất nhiều tuần đã trôi qua, các chỉ mục vẫn chưa được cập nhật.

Rất khó để có thể đánh giá hết sự nghiêm trọng của vấn đề này. Một trong số các yếu tố quan trọng của tìm kiếm tốt là sự cập nhật – đảm bảo rằng các chỉ mục có kết quả gần đây nhất. Thử tưởng tượng nếu các thông tin được cập nhật một năm sau khi xảy ra sự kiện. Hãy xem xét một ví dụ, cuộc khủng bố 11/9 năm 2001. Làm một tìm kiếm trên Google về “Trung tâm thương mại” vào tháng Mười một hoặc Mười hai, bạn sẽ chả tìm thấy kết nối nào về sự kiện này. Thay vào đó, bạn sẽ có các kết quả gợi ý về một trải nghiệm bữa tối tinh tế trên các Cửa sổ của Thế giới, tại tầng 107 của Tòa nhà Phía Bắc hiện không còn tồn tại.

Nửa tá kỹ sư đã chuyển các máy tính của họ vào một phòng họp. Từ đó, Google đã tạo ra phòng chiến tranh đầu tiên của mình. (Thời điểm sau đó – gần một năm sau khi chuyển từ căn nhà tại công viên Menlo đến văn phòng tại khu thương mại Palo Alto – Google lại di chuyển một lần nữa, đến một cơ sở có khuôn viên văn phòng rộng hơn, tại đường BayShore gần Mountain View. Các nhân viên gọi nó là Googleplex, một cách chơi chữ từ thuật ngữ toán học googolplex, nghĩa là một số lớn không tưởng.) Khi mọi người bắt đầu làm việc, họ sẽ đi đến phòng chiến tranh thay vì phòng làm việc. Và họ sẽ thức khuya. Dean đã ở đó cùng với Craig Silverstein, Sanjay Ghemawat và một vài người khác.

Họ xây dựng một hệ thống ứng dụng “đánh dấu điểm”, một cách để chỉ mục lưu giữ vị trí của nó nếu tai họa rơi xuống một máy chủ hoặc ổ cứng. Nhưng hệ thống mới này còn đi xa hơn – nó sử dụng một cách thức khác để xử lý một nhóm ổ cứng, giống kiểu xử lý song song trong điện toán (nơi mà một nhiệm vụ tính toán sẽ được phân chia ra nhiều máy tính hoặc bộ xử lý) hơn là công nghệ “phân mảnh” (sharding) Google từng sử dụng, nó sẽ phân chia mạng và gán các khu vực của nó cho các máy tính đơn lẻ. (Những người quen với các thuật ngữ máy tính có thể biết đến công nghệ này là “partitioning” (phân chia), nhưng, theo Dean nói, “mọi người tại Google gọi nó là phân mảnh vì nó nghe hay hơn.” Đối với các thầy phù thủy về cơ sở hạ tầng của Google, nó là thuật ngữ chủ chốt).

Thí nghiệm này dẫn đến một cải tạo đầy tham vọng về cách thức mà toàn bộ cơ sở hạ tầng của Google xử lý các tập tin. “Tôi luôn muốn xây dựng một hệ thống các tập tin. Và rõ ràng là chúng tôi sẽ phải làm việc này. Ý tưởng chủ yếu là chúng tôi muốn hệ thống tập tin đó tự động xử lý với các hỏng hóc và để làm như vậy nó sẽ phải lưu trữ nhiều bản sao và tạo ra các bản sao mới thì bản sao nào đó bị lỗi,” Ghemawat nói.

Một sự đổi mới khác, xuất hiện muộn hơn một chút, có tên là hệ thống in-RAM. Điều này bao gồm việc nhồi nhiều chỉ mục nhất có thể vào bộ nhớ thực tế của máy tính thay vì vào các ổ cứng chật chội và ít đáng tin cậy hơn. “Chỉ mục in-memory như là một yếu tố của hai hay ba cái rẻ hơn, vì tốc độ xử lý truy vấn trên mỗi máy của nó nhanh hơn rất nhiều”, Dean nói.

Hệ thống này biểu hiện bước tiếp cận của Google tới khoa học máy tính. Thực ra, chi phí cho một bộ nhớ cố định có thể cao đến mức việc sử dụng nó để lưu trữ Internet sẽ là một quan niệm gàn dở. Nhưng các kỹ sư của Google biết rằng tốc độ của công nghệ sẽ làm giảm giá thành, và họ thiết kế phù hợp với hoàn cảnh. Cũng vậy, Google – như cái tên nó ngụ ý – được đẩy mạnh để xử lý việc mở rộng dữ liệu lịch sử mà cuộc cách mạng số gây ra. Các đối thủ cạnh tranh, đặc biệt là những đối thủ đã thành công trong thời kỳ trước đó, khá là chậm chạp trong việc hoàn toàn chấp nhận hiện tượng này, trong khi Google coi nó bình thường như không khí. “Đơn vị của suy luận ở quanh đây là một terabyte”, Weynie Rosing, kỹ sư trưởng của Google năm 2003 nói (một terabyte tương đương với 10 nghìn tỷ bit dữ liệu). “Thậm chí là nó còn không thể trở nên hấp dẫn nếu không có nhiều terabyte hơn xuất hiện trong các vấn đề. Nên điều đó khiến bạn cuốn vào suy nghĩ về hàng trăm nghìn máy tính như là một cách chung để giải quyết các vấn đề.” Khi có nhiều sức mạnh để giải quyết các vấn đề, bạn không chỉ có khả năng giải quyết chúng nhanh hơn mà còn có thể làm nhiều hơn nữa, chẳng hạn như giải quyết các vấn đề thậm chí còn chưa từng được xem xét hay xây dựng các luận thuyết riêng cho mình.

Việc triển khai Google File System là một bước tiến về phía luận thuyết đó. Nó cũng là một sự phát triển hợp thời, vì các nhu cầu đối với hệ thống của Google sắp tăng lên một cách đột ngột. Google đã giành được một thỏa thuận về việc xử lý tất cả các lưu lượng tìm kiếm của Yahoo, một trong số các cổng thông tin lớn nhất trên mạng.

Thỏa thuận này – được công bố ngày 26/6/2000 – là bước phát triển bực bội đối với trưởng nhóm nghiên cứu của Yahoo, Udi Manber. Anh thường lập luận rằng Yahoo nên phát triển sản phẩm tìm kiếm riêng của mình, nhưng các ông chủ của anh không quan tâm. Những nhà điều hành của Yahoo, thay vào đó dành sự chú ý của họ vào phát triển thương hiệu – các mánh lới tiếp thị, như là đưa ra logo màu hồng của công ty trên chiếc máy Zamobi được dùng để dọn tuyết trong khoảng thời gian giữa các trận hockey của đội San Jose Sharks. “Tôi có sáu người làm việc trong đội nghiên cứu của mình,” Manber nói. “Tôi không thể có được người thứ bảy. Đây là một công ty có hàng nghìn người. Tôi đã không thể có được người thứ bảy.” Kể từ khi Yahoo không có ý định phát triển nghiên cứu riêng của mình, Manber có nhiệm vụ kiếm đối tượng tốt nhất để mua bản quyền.

Sau khi thử nghiệm Google và vài lần đến thăm Larry Page, Manber đề cử Yahoo sử dụng công nghệ của công ty này. Một nhượng bộ mà Yahoo cấp cho Google hóa ra là định mệnh: Trên các trang kết quả cho một tìm kiếm từ Yahoo, người sử dụng sẽ thấy một thông điệp thông báo rằng Google là người thực hiện việc tìm kiếm. Trang này thậm chí còn có logo Google. Do đó, hàng triệu người dùng Yahoo đã khám phá ra một công cụ tìm kiếm mà sẽ trở thành một phần trong cuộc sống của họ.

Trong bản thỏa thuận, Google đồng ý cập nhật chỉ mục của mình hàng tháng, điều trở nên khả thi sau thí nghiệm trong phòng chiến tranh. Lúc này, Google đã có thể tự hào rằng nó là chỉ mục lớn nhất với dữ liệu cập nhật nhất trong ngành công nghệ. Trong ngày thông báo thỏa thuận với Yahoo, Google báo cáo rằng các server của mình hiện đang giữ hơn một tỷ trang mạng. Hệ thống này tiếp tục là thứ hiện đại nhất cho đến hè năm 2003, khi Google mở ra một cuộc cải cách toàn bộ hệ thống chỉ mục để cho phép làm mới chỉ mục này theo từng ngày, thu thập các trang phổ biến thường xuyên hơn. Mật danh cho lần cập nhật năm 2003 là BART. Tiêu đề này ngụ ý rằng hệ thống của Google sẽ đạt được nguyện vọng (nếu không muốn nói là thành tựu) của hệ thống quá cảnh hàng loạt tại địa phương: “luôn đúng giờ, luôn nhanh chóng, luôn đúng kế hoạch”.

Mặc dù Google không bao giờ công bố thời điểm làm mới chỉ mục của mình nhưng mỗi khi nó thực hiện một thay đổi thì số lượng truy vấn trên toàn Thế giới luôn tăng nhẹ, cứ như thể toàn thế giới nhận ra trong tiềm thức rằng có kết quả cập nhật hơn đang hiện hữu.

Phản ứng của người dùng Yahoo về công nghệ của Google, dù vậy, có lẽ là rõ ràng hơn. Họ để ý rằng việc tìm kiếm trở nên tốt hơn và sử dụng nó nhiều hơn. “Lưu lượng tăng lên đến khoảng 50% trong hai tháng,” Manber hồi tưởng lại việc chuyển sang Google. Nhưng nhận xét duy nhất anh nhận được từ các nhà điều hành Yahoo là các phàn nàn rằng mọi người đang tìm kiếm quá nhiều và họ sẽ phải trả nhiều chi phí hơn cho Google.

Nhưng số tiền Google nhận được từ cung cấp dịch vụ tìm kiếm không phải khoản lợi nhuận lớn nhất. Giá trị lớn nhất mà công ty nhận được là cơ hội được tiếp cận với nhiều người sử dụng hơn và nhiều dữ liệu hơn. Chính dữ liệu sẽ đưa tìm kiếm của Google lên tầm cao mới. Thói quen tìm kiếm của người sử dụng, được nắm bắt và gói gọn trong các log có thể dùng để phân tích và khai thác, sẽ khiến Google trở thành cỗ máy học tập tối cao.

Amit Patel là người đầu tiên nhận ra giá trị các log của Google. Patel là một trong số những nhân viên đầu tiên của Google. Anh bắt đầu làm việc bán thời gian tại Google từ đầu năm 1999 trong khi vẫn tiếp tục lấy bằng tiến sĩ tại Stanford CS. Một trong số những dự án đầu tiên của anh tại Google hóa ra lại quan trọng hơn so với kỳ vọng của bất kỳ ai. Anh được yêu cầu “Đi tìm hiểu xem bao nhiêu người đang sử dụng Google, ai đang sử dụng nó và họ đang làm gì với nó”.

Nhiệm vụ đó đã thực sự hấp dẫn Patel, người mới chỉ bắt đầu tìm hiểu về các công cụ tìm kiếm và phân tích dữ liệu. Anh nhận ra rằng Google có thể là một thiết bị cảm biến rộng lớn về hành vi của con người. Ví dụ, anh để ý rằng các câu hỏi giúp làm bài tập về nhà thường tăng vọt vào các dịp cuối tuần. “Họ thường đợi đến tối Chủ Nhật để làm bài tập về nhà của mình, và sau đó họ tìm kiếm mọi thứ trên Google,” anh nói. Ngoài ra, bằng việc theo dõi xem những thông tin nào được tìm kiếm nhiều nhất trên Google, bạn có thể có được cái nhìn thoáng qua về thứ mà thế giới quan tâm trong thực tại. (Một vài năm sau, Patel sẽ đóng vai trò quan trọng trong việc xây dựng nên Google Zeitgeizt (tạm dịch: Hệ tư tưởng thời đại của Google), một bản tổng kết hàng năm, được phát hành vào cuối mỗi năm, về những chủ đề tìm kiếm phổ biến nhất.)

Nhưng thông tin mà người sử dụng cung cấp cho Google đi xa hơn chủ đề trong các truy vấn của họ. Google có khả năng nắm bắt mọi thứ người dùng làm trên trang đó trong log của mình, một thử nghiệm số về các hoạt động mà sự tồn tại của chúng có thể cung cấp chìa khóa đến các đổi mới trong tương lai. Từng khía cạnh trong thói quen của người sử dụng có một giá trị. Có bao nhiêu truy vấn, chúng dài bao nhiêu, những từ dùng nhiều nhất trong các truy vấn là từ nào, người dùng đánh dấu câu thế nào, họ có thường xuyên bấm vào kết quả tìm kiếm đầu tiên không, ai đã chỉ dẫn họ đến với Google, theo địa lý thì họ ở đâu. “Chỉ là các kiến thức cơ bản”, anh nhớ lại.

Những cái log đó biết kể chuyện. Không chỉ thời điểm hoặc cách thức người dùng sử dụng Google mà còn cả đối tượng sử dụng và cách họ suy nghĩ. Patel bắt đầu nhận ra rằng các này này có thể khiến Google thông minh hơn, và anh chia sẻ thông tin log với các kỹ sư tìm kiếm như Jeff Dean và Krishna Bharat, những người quan tâm sâu sắc đến việc cải thiện chất lượng tìm kiếm.

Đến thời điểm đó, Google chưa có cách thức cụ thể về việc lưu trữ các thông tin có thể cho công ty biết người sử dụng của mình là ai và họ đang làm gì. “Trong những ngày đó, dữ liệu được chứa trên các ổ cứng, mà chúng lại thường xuyên bị hỏng, và những cái máy đó thường được chuyển đổi để dùng cho việc khác”, Patel nói. Một ngày nọ, trong sự kinh hoàng của Patel, một trong số các kỹ sư đã chỉ vào ba cái máy và thông báo rằng anh ta cần chúng cho dự án của mình và chuẩn bị format lại các ổ đĩa đó, thứ mà lúc đó chứa hàng nghìn log truy vấn. Patel bắt đầu làm việc với các hệ thống sẽ dùng để chuyển những dữ liệu này đến một nơi an toàn. Cuối cùng, khi bắt đầu có sự phân bổ lực lượng lao động, ông ty yêu cầu có ít nhất một người làm việc trên máy chủ mạng, một người phụ trách chỉ mục, và một phụ trách các log.

Vài năm trước, một nhà nghiên cứu về trí tuệ nhân tạo tên là Douglas Lenat đã bắt đầu Cyc16, một nỗ lực cực kỳ tham vọng nhằm dạy cho các máy tính tất cả kiến thức thông thường mà mỗi người đều hiểu. Lenat thuê các sinh viên để đánh máy một cách cẩn thận tất cả mọi thông tin trong dòng chảy bất tận của những chuyện đời thường thậm chí là hiển nhiên nhất: Một ngôi nhà là một cấu trúc gồm một mái và các bức tường… mọi người sống trong các ngôi nhà… các ngôi nhà có cửa trước… các ngôi nhà có cửa sau… các ngôi nhà có nhiều phòng ngủ và khu bếp… nếu bạn đốt lửa trong một ngôi nhà, nó có thể bị cháy – hàng triệu mẩu thông tin mà một máy tính có thể lấy ra và sử dụng để khi đến thời điểm phân tích một thông tin đề cập đến một ngôi nhà, máy tính đó có thể đưa ra các kết luận thích hợp. Dự án này đã không bao giờ sản xuất ra một máy tính có thể xử lý thông tin tốt như một đứa trẻ bốn tuổi.

Nhưng thông tin mà Google bắt đầu thu thập còn đồ sộ hơn nhiều, và công ty nhận được nó một cách miễn phí. Google nhận ra rằng phản hồi tức thời giống như là cơ sở của một cơ chế học hỏi của trí tuệ nhân tạo. “Doug Lenat làm đề tài của mình bằng cách thuê những người này và đào tạo họ để viết ra các sự việc theo một cách nhất định,” Peter Norvig, người gia nhập Google từ năm 2001 với vai trò giám đốc phụ trách việc học hỏi của máy móc. “Chúng tôi thực hiện nó bằng cách nói rằng: ‘Hãy lấy các thứ mà mọi người đang làm một cách tự nhiên’”.

Ở mức độ cơ bản nhất, Google có thể biết được người sử dụng hài lòng như thế nào. Diễn giải lại theo Tolstoy, những người sử dụng vui vẻ đều giống nhau. Dấu hiệu rõ nhất về niềm vui của họ chính là “lần bấm dài” (long click) – điều này xảy ra khi ai đó đến tìm kiếm một kết quả, lý tưởng nhất là kết quả đầu tiên, và không quay lại. Điều đó nghĩa là Google đã hoàn thành truy vấn một cách thành công. Nhưng những người sử dụng không vui vẻ đều không vui theo cách của riêng mình. Đáng kể nhất là các “lần bấm ngắn” khi một người sử dụng mò theo một kết nối và ngay lập tức quay trở về để thử lại. “Nếu họ gõ cái gì đó và sau đó tiếp tục và thay đổi truy vấn của họ, bạn có thể nói rằng họ không vui”, Patel nói. “Nếu họ đi tới trang kết quả tiếp theo, nó là dấu hiệu cho biết họ không vui. Bạn có thể sử dụng các dấu hiệu, từ những người không hài lòng với những gì chúng ta đưa cho họ, để quay lại và nghiên cứu những trường hợp đó và tìm kiếm các yếu tố nhằm cải thiện việc tìm kiếm.”

Công cụ tìm kiếm của Google từ từ xây dựng đủ tri thức để các kỹ sư có thể tự tin cho phép nó chọn khi nào đổi từ này thành một từ khác. Sự cải tiến trước đó về cơ sở hạ tầng của Google, bao gồm cả các công nghệ mà Jeff Dean và Sanjay Ghemawat phát triển nhằm nén dữ liệu để Google có thể đưa chỉ mục vào bộ nhớ máy tính thay vì các ổ đĩa cứng, đã giúp điều này trở nên khả thi. Đó chính là một dự án công trình kỹ thuật dùng để tăng tốc các truy vấn tìm kiếm, cho phép một sự đổi mới hoàn toàn khác biệt. “Một trong số các ưu điểm lớn về chỉ mục trong bộ nhớ đó là nó tăng tính khả thi của việc nhìn vào một truy vấn có ba từ và nói, ‘Tôi muốn xem dữ liệu của mười lăm từ đồng nghĩa, vì chúng đều liên quan đến nhau’” Dean nói. “Bạn không bao giờ đủ khả năng làm điều đó trên một hệ thống dựa vào ổ cứng, vì bạn sẽ phải thực hiện mười lăm cuộc tìm kiếm trên ổ đĩa, và nó sẽ khiến chi phí phục vụ của bạn bị phồng lên rất nhiều. Một chỉ mục trong bộ nhớ hướng đến sự khám phá tích cực hơn của các từ đồng nghĩa và các thứ đại loại như vậy.”

“Chúng tôi đã có một khám phá cực kỳ hữu hiệu,” kỹ sư nghiên cứu Amit Singhal, người đã làm việc rất chăm chỉ về các từ đồng nghĩa. “Mọi người thường thay đổi các từ trong truy vấn của mình. Do vậy ai đó sẽ nói: ‘Hình ảnh của chó’, sau đó họ lại nói: ‘hình ảnh của cún con’. Điều này cho thấy chó và cún con có thể thay cho nhau. Chúng ta biết rằng khi bạn đun nước, nó là nước nóng. Chúng tôi đang học ngữ nghĩa từ con người, và đó là một tiến bộ lớn.”

Theo cách tương tự, bằng việc phân tích cách thức mà mọi người xem lại các bước sau một lỗi chính tả, Google phát minh ra ứng dụng kiểm tra chính tả của riêng mình. Ứng dụng này được cài đặt bên trong hệ thống; nếu bạn gõ một từ không chính xác, kiểu gì Google cũng sẽ đưa cho bạn những kết quả đúng.

Nhưng cũng có trở ngại. Hệ thống từ đồng nghĩa của Google bắt đầu hiểu rằng một con chó tương đương với một cún con và nước sôi nghĩa là nóng. Nhưng các kỹ sư cũng phát hiện ra rằng công cụ tìm kiếm cho rằng một cái “hot dog” (bánh mỳ kẹp xúc xích) giống như một chú cún con đang sôi. Vấn đề đã được khắc phục, Singhal nói, bằng một đột phá sau đó vào năm 2002, sử dụng học thuyết của Ludwig Wittgenstein về cách thức các từ được định nghĩa bởi bối cảnh. Khi Google thu thập và lưu trữ hàng tỷ tài liệu và trang mạng, nó phân tích các từ nào thường đứng gần nhau. “Hot dog” sẽ được tìm thấy trong các tìm kiếm có chứa “bánh mỳ” và “mù tạt” và “các trận đấu bóng rổ” – chứ không phải “những chú cún con với bộ lông rất nóng”. Cuối cùng, cơ sở kiến thức của Google hiểu phải làm gì với một truy vấn liên quan đến hot dog – và hàng triệu các từ khác. “Ngày nay, nếu bạn gõ ‘Gandhi bio’, chúng tôi hiểu rằng ‘bio’ nghĩa là ‘biography’ (tiểu sử, lý lịch)”, Singhal nói. “Và nếu bạn gõ ‘bio warfare’, nó có nghĩa là ‘biological’ (sinh học)”.

Sau nhiều năm, Google sẽ khiến dữ liệu trong các log trở thành chìa khóa để phát triển công cụ tìm kiếm của mình. Công ty sẽ sử dụng chỗ dữ liệu đó trên gần như từng sản phẩm khác mà công ty sẽ phát triển. Nó sẽ không chỉ ghi lại thói quen của người sử dụng trong các sản phẩm đã được phát hành mà còn tính toán thói quen đó trong vô số các thí nghiệm để thử nghiệm các ý tưởng và cải tiến mới. Hệ thống của Google học được càng nhiều, càng nhiều dấu hiệu mới sẽ được đưa vào trong công cụ tìm kiếm để xác định sự liên quan tốt hơn.

Sergey Brin từng viết phần gốc của công cụ tìm kiếm Google, có nhiệm vụ xử lý sự liên quan. Thời điểm đó còn dựa phần lớn vào PageRank, nhưng từ đầu năm 2000, ngay khi Amit Singhal nhận ra rằng theo thời gian, ngày càng nhiều các tín hiệu diễn giải được bổ sung, khiến PageRank giảm bớt vai trò trong việc quyết định kết quả. (Thực tế là từ năm 2009, Google từng cho biết đang sử dụng hơn hai trăm tín hiệu – mặc dù con số thực gần như chắc chắn là cao hơn rất nhiều – bao gồm cả các từ đồng nghĩa, tín hiệu địa lý, tín hiệu làm mới, và thậm chí là một tín hiệu cho các website bán pizza). Mã (code) rất cần được viết lại; Singhal thậm chí không thể tiếp tục đọc chỗ code mà Brin đã viết. “Tôi viết cái mới ngay lập tức,” anh nói.

Singhal hoàn thành một phiên bản của mã code mới trong hai tháng, và vào tháng Một năm 2001 nó được đưa vào thử nghiệm. Nhiều tháng sau đó, Google đưa nó ra cho một nhóm người sử dụng của mình và khá hài lòng với kết quả. Họ vui vẻ hơn. Trước hè năm đó, Google đã bật công tắc và trở thành một dịch vụ khác, chính xác hơn. Với thành quả lao động này, Singhal đã được trao danh hiệu Google Fellow (Đồng chí Google) và nhận phần thưởng có giá trị lên tới hàng triệu đôla.

Các công cụ tìm kiếm của Google từ đó sẽ trải qua các biến đổi lớn sau mỗi hai hoặc ba năm. Giữa mỗi lần viết lại trọng đại, các đội đảm bảo chất lượng tìm kiếm của Google liên tục đưa ra các cải tiến tăng trưởng. “Chúng tôi luôn để mắt đến các truy vấn, thường tìm ra lỗi và nói: ‘Tại sao, tại sao, tại sao?’” Singhal nói. Bản thân anh từng tham gia trong một cuộc tìm kiếm không ngừng để xác định các kết quả nghèo nàn mà từ đó có thể chỉ ra các vấn đề lớn hơn trong thuật toán. Anh bắt đầu có thói quen kiểm tra các log được lưu trữ bởi Google về thói quen của người sử dụng và lấy ra một số truy vấn ngẫu nhiên. Anh biên soạn một danh sách hàng chục nghìn truy vấn, chạy chúng đồng thời trên phiên bản tìm kiếm hiện tại của Google và phần sửa đổi được đề xuất. Lợi ích thứ hai của một thử nghiệm như vậy chính là nó thường nhận diện mô hình lỗi trong một số truy vấn nhất định.

Theo như những gì anh có thể nhớ được, đó là cách mà một truy vấn gây tranh cãi – Audrey Fino – bước vào cuộc sống của Amit Singhal.

Nó có vẻ như khá đơn giản: Ai đó gõ “Audrey Fino” lên thanh tìm kiếm của Google và không vui với kết quả. Thật dễ để Singhal thấy được tại sao. Các kết quả cho truy vấn đó bị chi phối bởi các trang tiếng Ý đang tuôn ra hàng tràng về vẻ hấp dẫn của một nữ diễn viên gốc Bỉ – Audrey Hepburn. Đây có vẻ không phải là cái mà người dùng này đang tìm. “Chúng tôi nhận ra rằng đây là tên của một người,” Singhal nói. “Có một người ở đâu đó tên là Audrey Fino, và hệ thống không đủ thông minh để biết được điều này.” Cái nữa là, anh nhận ra rằng đó là dấu hiệu của một lỗi lớn hơn cần có thuật toán điều trị. Tóm lại là, công cụ tìm kiếm này gặp khó khăn với những cái tên.

Điều này thúc đẩy một nỗ lực trong nhiều năm để Singhal và nhóm của anh làm ra một hệ thống nhận diện tên trong công cụ tìm kiếm. Những cái tên đều quan trọng. Chỉ có 8% các truy vấn của Google là về tên – và một nửa trong số đó là những người nổi tiếng – nhưng những truy vấn với cái tên mơ hồ hơn lại là các trường hợp mà người dùng có nhu cầu cụ thể, quan trọng (bao gồm cả “tìm kiếm hư danh” khi mà người dùng Google chính mình, một thực tế chung hài hước). Singhal và các đồng nghiệp bắt đầu theo cách hay làm: Với dữ liệu. Để cải thiện tìm kiếm, Google thường tích hợp các cơ sở dữ liệu ngoài, và lần này Google mua bản quyền của White Pages, cho phép sử dụng tất cả thông tin, bao gồm tên, địa chỉ và điện thoại được chứa trong hàng trăm tập giấy in dầy. Công cụ tìm kiếm của Google hút lấy những cái tên và phân tích chúng đến khi nó có thể hiểu một cái tên là gì và làm thế nào để nhận biết nó trong hệ thống.

Trong vài tháng, đội của Singhal đã xây dựng hệ thống để sử dụng thông tin đó và phân tích cú pháp của các truy vấn tên một cách thích đáng. Một thời gian sau, Singhal một lần nữa gõ lại truy vấn rắc rối đó. Lần này, hiện lên trên đầu là hàng tràng các trang về một cô gái hấp dẫn tinh quái từng đóng trong phim Roman Holiday, có một kết nối cung cấp thông tin về một luật sư, người từng – ít nhất là trong một khoảng thời gian – sống tại Malta: Cô Audrey Fino.

“Như vậy hiện giờ chúng tôi có thể nhận biết tên và xử lý đúng cách khi có vấn đề xuất hiện,” Singhal nói, năm năm sau cuộc truy lùng đó. “Và hệ thống nhận diện tên của chúng tôi hiện giờ còn tốt hơn nhiều so với khi tôi làm ra nó, và tốt hơn bất kỳ thứ gì khác ngoài kia, cho dù người khác có nói gì đi nữa.”

Một lần, vào năm 2009, anh trình diễn cho một người khách xem hệ thống của mình hoạt động tốt như thế nào, ngoài ra cũng hé lộ một số bí mật khác của công cụ tìm kiếm này. Anh mở máy laptop của mình và gõ vào đó truy vấn: “mike siwek luật sư mi”.

Anh gõ mạnh vào phím ENTER. Trong một khoảng thời gian được tính toán chính xác nhất theo nhịp đập cánh của chim ruồi, mười kết quả xuất hiện. Trong trường hợp này, kết quả đầu tiên là một kết nối đến trang chủ của một luật sư có tên Michael Siwek tại Grand Rapids, Michigan. Thành công này đến như là kết quả của nhiều nỗ lực đã được dành để giải quyết vấn đề Audrey Fino. Chìa khóa dẫn đến việc hiểu một truy vấn như thế này, Singhal nói, là sự mầu nhiệm huyền bí của “cách thức”: Đó là một công cụ tìm kiếm phân tích một loạt các từ được nhập vào trường truy vấn và phân loại chúng theo cách mà một con người thông minh sẽ làm.

“Phân tích truy vấn [Siwek] này từ quan điểm của một kỹ sư”, Singhal nói. “Phần lớn các công cụ tìm kiếm tôi từng biết sẽ bắt đầu ‘một từ, hai từ, ba từ, bốn từ, xong’. Tại Google, chúng tôi nói: ‘A ha! Chúng ta có thể bẻ nó ở đây!’ Chúng tôi mường tượng rằng ‘luật sư’ không phải là họ và ‘Siwek’ không phải là tên đệm,” anh nói. “Và tiện đây, luật sư không phải là một thị trấn tại Michigan. Luật sư là người được ủy quyền.”

Tất cả điều này giúp giải thích làm thế nào Google có thể tìm được ai đó, mà tên người này có thể chưa bao giờ xuất hiện trong một tìm kiếm nào trước đây. (Một phần ba tất cả các truy vấn đều là những yêu cầu chưa từng được khai phá). “Mike Siwek là một ai đó gần như chưa từng được tiếp cận trên Internet,” Singhal nói. “Tìm kim đáy bể, nó diễn ra như vậy đấy”.

Lịch sử bí mật của Google được nhấn mạnh bởi những tiến bộ tương tự, một di sản chấn động trong khoa học máy tính và sự kín miệng của công ty. Những người hùng tìm kiếm của Google là những người hùng tại Google nhưng vô danh ở nơi khác. Công cụ tìm kiếm của Google luôn có những tiến bộ rõ rệt trong việc thu thập thông tin, lập chỉ mục, đưa ra những kết quả nhanh và chính xác. Những kết quả mà Google đạt được dựa trên việc thu thập nhiều thông tin nhất có thể. Google gọi cái này là “tính chất toàn diện” và đã có một đội khoảng 300 kỹ sư đảm bảo việc các chỉ mục nắm bắt được mọi thứ. Một phó giám đốc phụ trách kỹ thuật của Google nói: “Chúng tôi muốn có một bản sao giống bản gốc nhất có thể, cả về thời gian và hình ảnh, và sau đó chúng tôi muốn tổ chức theo cách thức phục vụ dễ dàng và hiệu quả, và cuối cùng là xếp hạng”.

Google làm tất cả những gì có thể để truy cập các trang đó. Nếu trang mạng yêu cầu người dùng điền vào mẫu đăng ký để xem một nội dung nhất định, Google có thể đã dạy các con nhện của mình cách điền vào mẫu đó. Đôi khi nội dung bị khóa bên trong các chương trình chạy khi người dùng ghé thăm một trang – các ứng dụng chạy trên ngôn ngữ JavaScript hoặc chương trình media như Adobe’s Flash. Google biết cách để nhìn vào bên trong các chương trình đó và lôi nội dung trong đó ra cho chỉ mục của mình. Google thậm chí sử dụng nhận dạng ký tự quang học để tìm xem liệu một tấm ảnh trên website có chữ trên đó hay không.

Sự tích lũy của tất cả những cải tiến đó kéo dài vị trí dẫn đầu của Google so với các đối thủ, và số lượng người sử dụng dịch vụ của Google đã tăng với tốc độ chóng mặt, giúp Google nhanh chóng chiếm lĩnh thị trường. Thậm chí những đối thủ khó nhằn nhất của Google cũng phải thừa nhận rằng Brin và Page đã xây dựng nên điều gì đó thật đặc biệt. “Trong ngành thương mại về công cụ tìm kiếm, Google thổi bay những người sáng tạo đầu tiên, đơn giản là thổi họ bay mất,” Bill Gates nói. “Và những thứ còn lại của những người đó sẽ sớm bị chìm vào quên lãng”.

Một trong số những vinh quang của Page Rank (ngay từ đầu đã vượt trội hơn cả AltaVisa) là khả năng chống spam. (Thuật ngữ này chỉ những thư điện tử không được chào đón, nhưng những đường dẫn đến trang có chứa thứ này vẫn đứng ở vị trí cao trên trang kết quả vì đánh lừa được hệ thống.

Người chịu trách nhiệm tạo ra sản phẩm tìm kiến an toàn (Safe Search), thứ sẽ cho phép mọi người chặn bỏ các trang khiêu dâm khỏi các kết quả tìm kiếm, có tên là Matt Cutts. Thoát khỏi nội dung khiêu dâm không mong muốn luôn mà một ưu tiên đối với Google. Nỗ lực đầu tiên của công ty là xây dựng một danh sách gồm khoảng 500 từ “dơ bẩn”. Nhưng năm 2000, Google nhận được một hợp đồng cung cấp dịch vụ tìm kiếm cho một nhà cung cấp muốn mang phiên bản tìm kiếm family-safe (an toàn cho gia đình) cho các khách hàng của mình. Brin và Page hỏi Cutts về suy nghĩ của anh ta đối với khiêu dâm. Anh sẽ phải nghiên cứu chúng rất nhiều để làm ra một hệ thống lọc nó ra khỏi Google.

Các trang khiêu dâm lớn hoàn toàn ủng hộ tiến trình này; họ biết rằng sẽ chẳng tốt đẹp gì cho họ nếu những người không quan tâm đến nội dung khiêu dâm vô tình gặp phải cái nhà kho tội lỗi của họ, khiến họ trở thành đối tượng của những kẻ bới lông tìm vết và các nhà lập pháp. Nhưng không phải tất cả những trang này đều là công dân tốt. Cutts để ý rằng một trang dơ bẩn nọ đã sử dụng một số biện pháp thông minh để “chơi” hệ thống chặn của Google và ghi điểm cao trong các kết quả tìm kiếm. “Đó là khoảnh khắc cực kỳ bất ngờ”, Cutts nói. “PageRank và phân tích kết nối có thể chống spam, nhưng không có thứ gì là spam không thể đâm thủng”.

Vấn đề đi xa hơn cả khiêu dâm. Google đã chiếm được lòng khán giả một phần vì nó hữu hiệu trong việc tiêu diệt spam tìm kiếm. Nhưng vì Google đang là phương tiện chi phối về tìm kiếm mọi thứ trên Internet, một từ khóa đưa ra có xếp hạng cao có thể đưa đến doanh thu hàng triệu đô la cho một trang. Các trang hiện giờ đang dành thời gian, năng lượng và những phù thủy công nghệ để dịch các tiến trình của Google và tăng hạng pagerank một cách nhân tạo. Thủ đoạn này được gọi là tối ưu hóa công cụ tìm kiếm hay SEO. Bạn có thể thấy rất rõ vấn đề này khi gõ tên của một khách sạn. Trang web của khách sạn thực tế đó không hiển thị trong những kết quả đầu tiên. Thay vào đó, các kết quả hàng đầu bị chiếm lĩnh bởi các công ty chuyên về đặt phòng khách sạn. Việc này khiến Google trở nên ít hữu dụng hơn. Cutts tìm đến Wayne Rosing và nói với anh ta rằng công ty này thực sự cần nghiên cứu việc chặn spam. Rosing bảo anh cứ thẳng tiến mà thử.

Cần phải có sự cân bằng. Các doanh nghiệp hợp pháp, và cả các công ty hoạt động mờ ám, đều tham gia trò vui. Những chuyên gia tư vấn được trả hậu hĩnh để tìm cách dịch ngược PageRank và các công nghệ khác của Google. Cả những cá nhân nghiệp dư cũng đã tham gia vào cuộc chơi, tìm mua những cuốn sách như Tối ưu hóa Công cụ Tìm kiếm cho mọi người. Các chuyên gia cũng thường xuyên gặp gỡ và thảo luận về những vấn đề này.

Google thừa nhận rằng một số phương pháp SEO cụ thể (Search Engine Optimization For Dummies) – chẳng hạn như đưa vấn đề nội dung của trang lên tiêu đề hay thuyết phục quản trị web của các website phổ biến đặt đường kết nối dẫn đến site của bạn – có tác dụng cho mạng nói chung. Nhưng điều này cũng đặt ra một câu hỏi: Nếu một website phải cần đến các yếu tố bên ngoài mới có thể tăng thứ hạng, vậy thì chẳng phải đây là một thất bại của Google hay sao, khi mà nhiệm vụ của Google là trả về cho người dùng các kết quả tốt nhất, không cần biết thông tin được định dạng thế nào hay nó được dẫn kết nối từ đâu đến?

“Mô hình lý tưởng là không ai phải học SEO,” Cutts nói. “Nhưng sự thực là nó có tồn tại và mọi người đang phải cố gắng để tự nâng tầm của mình.” Cutts đã thừa nhận rằng bởi vì không phải ai cũng có chuyên môn về SEO, nên đôi khi Google đã đánh giá thấp những trang web đáng giá. Có một ví dụ khá nổi tiếng: Truy vấn “Eika Kerzen”. Đây không phải là tên người mà thực tế là tên của một hãng sản xuất nến của Đức (kerzen trong tiếng Đức có nghĩa là “nến”). Thật đáng xấu hổ vì thông tin về nhà sản xuất này lại có thứ hạng rất thấp trong khi những từ khóa đó đáng lẽ đã phải giúp tìm ra những sản phẩm tuyệt vời của Eika Kerzen. Vấn đề này bị đổ lên đầu Amit Singhal, người đã sửa đổi thuật toán để Google dịch một phần của truy vấn sang một ngôn ngữ khác, giải pháp cho toàn bộ những kết quả tìm kiếm phiền toái dạng này.

Một cuộc chạy đua âm ỉ đã nổ ra giữa các thuật toán tìm kiếm của Google và các công ty đang cố gắng lợi dụng hệ thống để trục lợi. Trong nhiều năm, những thay đổi trong cơ chế chặn spam được đều đặn triển khai trong các cập nhật chỉ mục hàng tháng của Google. Google tiến hành cập nhật này theo chu trình của mặt trăng. “Bất cứ khi nào mặt trăng tròn sắp xuất hiện, mọi người lại bắt đầu mong ngóng các thay đổi của Google,” Cutts cho biết. Cộng đồng SEO sẽ căng thẳng chờ đợi những thay đổi có thể sẽ loại đường link của mình ra khỏi vị trí thích hợp. Khi những giá trị mới vừa được thể hiện ở kết quả tìm kiếm, cộng đồng SEO sẽ cố gắng để tìm ra logic ẩn phía sau thuật toán mới và tính kế để những đường link bị “hạ bệ” có thể tìm lại được vị trí ban đầu của chúng. Chuỗi những sự việc này được đặt tên là “điệu nhảy Google”. (Mọi việc càng trở nên rối rắm hơn sau khi dự án BART thay đổi hình thức cập nhật chỉ mục, các chỉ mục liên tục được cập nhật thay vì từng đợtn hư trước kia .)

Thông thường, sự thay đổi về thứ hạng là không đáng kể, và bao giờ cũng có cách để khôi phục một kết nối về vị trí hào quang trước đó. Nhưng cũng có những lần Google xác định được hành vi mà theo đánh giá là đang cố gắng khai thác các lỗ hổng trong hệ thống xếp hạng, khi đó Google sẽ điều chỉnh hệ thống để che lấp những khuyết điểm này – đồng nghĩa với việc đẩy những kết nối sử dụng phương pháp đó xuống dưới cùng. Về cơ bản, những kết nối này sẽ không còn cơ hội để xuất hiện ở các vị trí phía trên đối với những từ khóa tìm kiếm phổ biến: Chúng sẽ lén lút tăng thứ hạng cho mình bằng cách tạo nên một đội quân các kết nối. Dù thế nào, những công ty bị đối xử bằng cách này thường cảm thấy bị xúc phạm.

Cutts hiểu rằng sự mập mờ, không rõ ràng có thể ảnh hưởng xấu tới công ty và tự nhận trách nhiệm bảo vệ công ty trước cộng đồng SEO. Với biệt hiệu “Gã Google”, Cutts trả lời các câu hỏi và cố gắng đánh bại những âm mưu, rất nhiều trong số đó tập trung xung quanh nghi ngờ rằng cách chắc chắn nhất để tăng thứ hạng tìm kiếm là mua các quảng cáo của Google. Nhưng Cutts không thể nói quá nhiều. Phần lớn là vì mối đe dọa đến từ các spammer – cũng như từ nỗi lo sợ rằng những thông tin về hệ thống có thể làm lợi các đối thủ – Google luôn giữ bí mật tuyệt đối cho các thuật toán của mình. Sau vài năm, đội chuyên về spam của Cutts đã lớn mạnh đáng kể (cũng giống như Google, Cutts sẽ không nêu con số cụ thể). “Tôi có thể tự hào nói rằng tỉ lệ spam qua website đã giảm đi rất nhiều so với vài năm trước đây”, anh chia sẻ.

Nhưng Google cũng phải trả giá. Khi công ty chiếm được vị thế thượng phong trên thị trường tìm kiếm – hơn 70% thị phần tại Mỹ, con số này thậm chí còn cao hơn ở một số quốc gia – các nhà phê bình cũng càng lúc càng thấy khó chịu cứ phải tin những lời của Google rằng hãng này đang không sử dụng các thuật toán của mình để kinh doanh và cạnh tranh. Để bảo vệ chính mình, Google đã biện hộ rằng: Cố tình thay đổi kết quả tìm kiếm tốt nhất sẽ làm cho sản phẩm của Google không còn hiệu quả, do đó có thể khiến người dùng mất niềm tin. Nhưng Google cũng từ chối công bố dữ liệu chứng minh rằng hãng làm việc một cách ngay thẳng, có nghĩa là Google chấp nhận rủi ro khi cố gắng giữ niềm tin của người dùng. Nếu bạn không tin tưởng Google, làm thế nào bạn có thể tin tưởng cái thế giới thể hiện qua những kết quả tìm kiếm của Google?

 

Leave a Reply

Your email address will not be published. Required fields are marked *