Khởi nghiệp

Việt Nam đã từng có 3 công cụ tìm kiếm tiếng Việt nội địa tranh giành nhau thị phần

Có lẽ ít người biết cách đây hơn 10 năm, Việt Nam đã từng có 3 công cụ tìm kiếm tranh giành nhau thị phần: PanVietnam, HoaTieu.com và Vinaseek. 

Cách đây ít lâu, công cụ tìm kiếm tiếng Việt Cốc Cốc chính thức ra mắt sau một thời gian dài phát triển. Việt Nam đã từng có nhiều đơn vị có nỗ lực tương tự ví dụ như VCCorp với BaamBoo, Tinh Vân với xalo, hay Sóc Bay... nhưng đa phần đều không thu được nhiều thành quả.


PanVietnam.com 

Tác giả của PanVietnam Search Engine là anh Nguyễn Thế Vinh (1976), anh Hoàng Thanh Tùng (1978) và anh Lê Hồng (1978) thuộc Công ty NetNam, Viện Công nghệ thông tin. Được nghiên cứu và phát triển trong một thời gian khá dài, hệ thống NetNam Search Engine v1.0 được đưa vào phục vụ từ cuối năm 2000 đã được rất nhiều người sử dụng mạng thời đó quan tâm. NetNam SE được nâng cấp lên phiên bản v2.0 vào 05/9/2001 và được tiếp tục nâng cấp lên phiên bản v3.0 beta vào 07/11/2001. Sau gần 2 tháng thử nghiệm, phiên bản v3.0 được chính thức giới thiệu vào ngày 1/1/2002. Năm 2003 PanVietNam được trao Giải thưởng Khoa học Kỹ thuật Thanh niên lần thứ 13, đây là giải thưởng Khoa học Kỹ thuật uy tín vào thời điểm đó.

 

 

Điểm lại một số thông tin báo chí giới thiệu và chính từ PanVietnam thì:

"Như những công cụ tìm kiếm tiếng Việt bấy giờ, hệ thống này hỗ trợ tiếng Việt với ba bộ mã chính: Unicode, TCVN và VNI. Nó cũng được trang bị những công nghệ mới nhất trong tìm kiếm thông tin gồm các giải thuật lập chỉ mục cơ sở dữ liệu, xử lý song song, lọc bỏ tạp nhiễu và trùng lặp, cơ chế trả lời kết quả thông minh. Số lượng tài liệu được tìm kiếm không hạn chế. Hệ thống được chia thành ba tầng chính, gồm tầng: thu thập thông tin, nhận dạng và chuyển đổi thông tin thành dạng text, lập cơ sở dữ liệu cho các thông tin text. Mỗi tầng được chia thành nhiều đơn vị độc lập, hoạt động theo kiểu chia sẻ tính toán hoặc dự trữ (redundant). Vì vậy, nó cũng thực hiện cung cấp dịch vụ tìm kiếm cho từng website tùy theo yêu cầu cụ thể." [1]

Với việc đánh chỉ mục hơn 2000 Website và hơn 15 triệu văn bản vào thời đó, PanVietnam phần nào thoả mãn được nhu cầu tìm kiếm của người dùng và là một hiện tượng về Công cụ tìm kiếm khi mà Google chưa xử lý được triệt để về tiếng Việt.

Sau khi tên miền Panvietnam.com bị hack mất, PanVietnam chuyển nhà đến địa chỉ panvn.com với một giao diện khá lỗi thời. Slogan "Stop Searching, Start Finding!" khá ấn tượng tuy nhiên chức năng chính là tìm kiếm lại không hoạt động. Địa chỉ này cũng chỉ tồn tại một thời gian sau đó đã không còn truy cập được nữa.

Hoatieu.com

Đã từng là một hiện tượng và thần tượng của nhiều người sử dụng Internet thời bấy giờ với việc tìm kiếm khá hiệu quả cho dù ra mắt sau Vinaseek và PanVietnam, Hoatieu.com là sản phẩm của anh Vương Quang Khải (1979). Lý do ra đời Hoatieu.com theo anh Vương Quang Khải đó là

"Hiện nay đã có một lượng Web tiếng Việt khá lớn đang đưa lên mạng Internet. Nhưng khai thác những thông tin này vẫn gặp rất nhiều khó khăn. Đó là vì những máy tìm kiếm chuẩn của nước ngoài hiện nay như Google hay Altavista không hỗ trợ việc tìm kiếm tiếng Việt. Ngoài ra, tiếng Việt được lưu trữ dưới nhiều bảng mã khác nhau (Unicode, TCVN3, VNI, VIQR...) khiến cho việc tìm kiếm càng trở nên phức tạp. Người sử dụng phải tiến hành tìm nhiều lần, mỗi lần với một bảng mã tiếng Việt khác nhau để thu được những kết quả có thể'. Đó là lý do tôi ngồi viết hoatieu.com. Một máy tìm kiếm cho riêng người Việt." [2].

 

 

Tưởng chừng sự phát triển của Hoatieu.com sẽ là một thành công vì sự đầu tư và định hướng khá bài bản vì tuy ra đời sau các trang tìm kiếm như Vinaseek của Tinh Vân và Panvietnam của Viện CNTT, hoatieu.com có ưu điểm hơn là hỗ trợ tìm kiếm cả với hình ảnh và tin tức. Vào thời đó tính năng này mới chỉ có duy nhất với Google.com và theo dự định, Hoatieu.com sẽ còn tiếp tục phát triển thêm các tính năng như tìm kiếm âm nhạc MP3 theo tên bài hát, lời bài hát, tên ca sĩ, hỗ trợ các yêu cầu tìm kiếm tiếng Nhật và Trung. Thế nhưng sau 10 tháng hoạt động cuối tháng 8/2002 Hoatieu.com đã lặng lẹ cáo lui mà theo giải thích của anh Khải hồi đó thì

"cấu hình máy chủ do FPT không còn đáp ứng đủ số lượng truy cập, Hoatieu.com đang tìm kiếm đối tác khác và hy vọng sớm đáp ứng trở lại nhu cầu khai thác thông tin...".

 

Hiện tại tên miền Hoatieu.com không còn và đang được rao bán nhưng anh Vương Quang Khải vẫn đang tiếp tục cho đam mê còn dang dở với ngành Internet khi về đầu quân cho VNG. Hiện anh là phó chủ tịch phụ trách mảng Web và Mobile, trực tiếp điều hành các dịch vụ của Zing. LaBan, một dịch vụ danh bạ web mới được VNG ra mắt gần đây, có cái tên cũng dễ liên tưởng đến đứa con đầu lòng của anh.


Vinaseek.com

 

Xuất hiện đầu tiên, sống "dai và lâu" nhất trong số các Công cụ tìm kiếm tiếng Việt đời đầu của Việt Nam là Vinaseek của Tinh Vân. Theo như bài phỏng vấn ông Hoàng Tô, chủ tịch Hội đồng quản trị Tinh Vân Group thì:

"Vinaseek ra đời cách đây khá lâu, hơn 10 năm. Khi đó Tinh Vân tham gia xây dựng hệ thống mạng của Ban chuyên đề quốc gia về công nghệ thông tin, là mạng Intranet đầu tiên ở Việt Nam có kết nối đến tất cả các tỉnh, thành. Chúng tôi đã nhận thấy nhu cầu tìm kiếm thông tin tiếng Việt là rất lớn. Hồi đó, các bảng mã tiếng Việt chưa thống nhất, có tới 20 bảng mã khác nhau cùng tồn tại, và các search engine (công cụ tìm kiếm) khi đó như Altavista hay Yahoo không hỗ trợ mã tiếng Việt. Tinh Vân phát triển cộng cụ tìm kiếm tiếng Việt đầu tiên (khi đó mang tên VIS) và đến năm 2000 thì Vinaseek ra đời, phục vụ miễn phí trên Internet. Đây là công cụ tìm kiếm tiếng Việt mạnh nhất lúc bấy giờ (sau đó có thêm panvietnam.com và hoatieu.com). Vinaseek đã gây được một tiếng vang lớn, có số lượng người sử dụng kỷ lục. Sau đó theo xu thế chung, hầu hết các trang web tiếng Việt tuân thủ mã Unicode và Google đã hỗ trợ tốt bảng mã quốc tế này. Do đó Vinaseek không thể hiện được sức mạnh và phải nhường chỗ cho Google Việt Nam. Vinaseek vẫn tồn tại nhưng số người sử dụng nó không nhiều, chủ yếu là những khách hàng quen và muốn tìm kiếm sâu hơn vào các nhánh của trang web (vì Google tìm kiếm khá nông)." [3]

 

 

Theo như giới thiệu tính năng của Vinaseek vào thời đó thì:

"Hoàn toàn theo mô hình của các search engine nổi tiếng như Google, Altavista hay Yahoo, Vinaseek được bổ sung thêm khả năng tìm kiếm chính xác tiếng Việt, theo mọi bảng mã (TCVN3, VNI, TVCN-6909, VIQR...), theo mọi định dạng tài liệu văn bản (HTML, XML, RTF, WORD, PDF, PostScript...), theo mọi cách bỏ dấu khác nhau ("hoà" hay "hòa"). Vinaseek hỗ trợ tìm kiếm hình ảnh và âm thanh, hỗ trợ tìm kiếm gần đúng, tìm kiếm mờ (fuzzy search), tìm kiếm đồng âm và đồng nghĩa... Hiện Vinaseek đang lưu trữ chỉ mục và toàn văn của tất cả các trang Web tiếng Việt trên Internet (ước chừng 10 triệu văn bản) và nhận được hàng trăm ngàn lượt truy cập mỗi ngày." [4] 

Trong vòng 3 năm liên tục 2003 - 2005 Vinaseek được trao Cúp vàng Sản phẩm CNTT tại Tuần lễ Tin học lần thứ 11, 12, 13 cho lĩnh vực "Trang Web xuất sắc nhất" do Hội Tin học Việt Nam VAIP trao tặng.

Hiện tại tên miền Vinaseek.com thật may không bị chiếm mất như PanVietnam.com hay Hoatieu.com nhưng khi truy cập vào địa chỉ này thì nó được link thẳng đến xalo.vn một công cụ tìm kiếm mà theo giới thiệu của Tinh Vân thì được đầu tư hơn 1 triệu USD. Tuy nhiên hiện XaLo không còn bóng dáng gì của một công cụ tìm kiếm nữa mà thay vào đó là một trang tin tổng hợp đơn thuần.

Lời kết

Cuộc đua phát triển công cụ tìm kiếm phục vụ cho người Việt đã từng có những khởi đầu nhộn nhịp như thế. Tuy nhiên sau khi Việt Nam chính thức chuẩn hóa bảng mã unicode, nội dung web tiếng Việt nhanh chóng được thống nhất và bùng nổ. Unicode giúp tiếng Việt tiến một bước hội nhập với thế giới đồng thời tạo điều kiện cho các công cụ tìm kiếm nước ngoài không gặp phải khó khăn khi đánh chỉ mục nội dung tiếng Việt như trước nữa. Đến khi các đơn vị trong nước quay trở lại cuộc đua thì Google đã xác lập một vị thế tương đối vững chắc trên thị trường. Lần lượt các sản phẩm rơi rụng dần, cho đến nay hầu như không còn đơn vị nào trong nước theo đuổi tham vọng làm search engine nữa. Mãi đến tận gần đây mới xuất hiện 2 đơn vị được Nga đầu tư là iTim (tiền thân của Cốc Cốc) và Wada tham gia thị trường tìm kiếm tiếng Việt. Cả 2 đều là những cái tên mới mẻ, đội ngũ quy tụ nhiều chuyên gia của Nga đã từng thành danh với các sản phẩm Internet lớn như Yandex, mail.ru. Hy vọng trong thời gian tới sẽ được chứng kiến cuộc đua để ngỏ đã lâu này sôi động trở lại.

 

 

Xem thêm: “Thế giới chưa có công cụ tìm kiếm như của chúng tôi”

 

[1] Theo Vietnamnet

[2] Theo báo Lao Động

[3] Theo website Tinh Vân

[4] Theo TTXVN


Pandora