Các trợ lý ảo như Siri, Alexa và Google Assistant đã có hơn một thập kỷ để phát triển với mong muốn trở thành nhân tố không thể thiếu cho người dùng. Tuy nhiên, chính những tính toán sai lầm về hành vi người dùng và kỹ thuật công nghệ đã khiến những công cụ từng được công chúng kỳ vọng phải nhường chỗ cho các A.I chatbot tân thời như ChatGPT, Google Bard hay Bing A.I. Trong thập kỷ qua, Siri gặp khó khăn về mặt công nghệ trong khi Amazon và Google đã đánh giá sai cách mà các trợ lý giọng nói sẽ được sử dụng.


Vào ngày 4/10/2011, các giám đốc điều hành của Apple đã lên sân khấu trong một khán phòng đông đúc để ra mắt iPhone thế hệ thứ năm. Chiếc điện thoại trông giống hệt phiên bản trước đó nhưng có một tính năng mới khiến khán giả phải trầm trồ: Siri. Đây là một trợ lý ảo được tích hợp vào iOS, hệ điều hành của iPhone, và trở thành tính năng độc quyền của các thiết bị Apple, cho phép người dùng tương tác với điện thoại thông qua giọng nói và yêu cầu thực hiện các tác vụ như gọi điện, gửi tin nhắn, tra cứu thông tin, và điều khiển các ứng dụng.


Scott Forstall, khi đó là trưởng bộ phận phần mềm của Apple, đã ấn một nút trên iPhone để triệu hồi Siri và đặt câu hỏi cho trợ lý ảo này. Theo yêu cầu của ông, Siri đã kiểm tra thời gian ở Paris (phản hồi lúc đó là “8:16 chiều”), định nghĩa “nguyên phân” là gì và đưa ra danh sách 14 nhà hàng Hy Lạp được đánh giá cao (5 trong số đó ở Palo Alto). Khi đó, Forstall đã thốt lên rằng: “Tôi đã hoạt động trong lĩnh vực Trí tuệ Nhân tạo trong một thời gian dài, và điều này vẫn làm tôi ngỡ ngàng.


Đã 12 năm kể từ cột mốc đó. Cho đến hôm nay, hầu như người dùng không còn ấn tượng hay phụ thuộc vào Siri và các trợ lý ảo khác như Alexa của Amazon hay Google Assistant. Các công nghệ này đã trở nên trì trệ, và thậm chí đã trở thành chủ đề đùa cợt khi xuất hiện trong một đoạn kịch hài trên chương trình "Saturday Night Live" năm 2018 về một loa thông minh (Amazon Echo) dành cho người cao tuổi.


Siri gặp hạn chế khi phải hiểu các câu lệnh phức tạp và trả lời các câu hỏi mở. Siri cũng bị giới hạn trong hệ sinh thái của Apple khi không thể tích hợp với các thiết bị hoặc dịch vụ của bên thứ ba khác


Thế giới công nghệ ngày nay lại đang phấn khích với một loại trợ lý ảo khác: các A.I chatbot. Những công cụ này được trang bị Trí tuệ Nhân tạo tạo sinh (Generative A.I), chẳng hạn như ChatGPT từ công ty OpenAI ở San Francisco hay Google Bard, có thể tự tạo ra câu trả lời cho các câu hỏi bằng văn bản của người dùng một cách nhanh chóng. Người dùng đã sử dụng ChatGPT để xử lý các nhiệm vụ phức tạp như viết code, soạn thảo những đề xuất kinh doanh, hợp đồng, làm luận văn và thậm chí là viết tiểu thuyết.


Chỉ trong một thời gian ngắn tính từ khi được ra mắt vào tháng 11/2022, ChatGPT đã được cải thiện nhanh chóng. Điển hình là công cụ này hiện tại đã có thể biên soạn thơ Haiku (một thể thơ truyền thống của Nhật Bản). Trong tháng 3/2023, OpenAI đã ra mắt GPT-4 - công nghệ tiên tiến nhất của công ty này. Sự hào hứng xung quanh các A.I chatbot đã gợi lại cách mà Siri, Alexa và các trợ lý giọng nói khác từng khiến thế giới phấn khích. Nhưng từ đâu mà chúng đã đánh mất vị thế dẫn đầu trong cuộc đua trí tuệ nhân tạo?


Những tính toán sai lầm về kỹ thuật


Trong thập kỷ qua, các trợ lý ảo đã gặp nhiều trở ngại. John Burkey, một cựu kỹ sư của Apple từng làm việc trong các dự án Siri, cho biết Siri gặp phải những trở ngại về công nghệ bao gồm cả đoạn mã phức tạp phải mất hàng tuần để cập nhật các tính năng cơ bản. Các cựu nhân viên cho biết Amazon và Google đã tính toán sai cách sử dụng trợ lý giọng nói, dẫn đến việc đầu tư vào các lĩnh vực công nghệ này trở nên lãng phí. Và khi những thí nghiệm đó thất bại, sự hào hứng của công chúng dành cho công nghệ ở các công ty giảm dần.


Alexa từng bị chỉ trích vì vấn đề kiểm soát quyền riêng tư và dữ liệu


Ngay trong thời điểm mà Alexa của Amazon, Cortana của Microsoft và Google Assistant trở thành đối thủ của Siri, trợ lý ảo đến từ “ông lớn” Apple đã vấp phải nhiều ý kiến về việc chậm cải tiến. Tờ The Verge vào năm 2016 đã nói rằng các bản nâng cấp lớn của Siri là vô nghĩa nếu nó không thể hiểu người dùng muốn gì. Siri vẫn chưa tốt trong việc nhận dạng giọng nói và dẫu cho nó hoạt động đúng, kết quả thường rất tệ. Trong nhiều trường hợp, Siri hiểu sai ý của người dùng, không biết câu trả lời hoặc không thể diễn đạt thành lời. Vào tháng 6/2017, The Wall Street Journal đã xuất bản một bài báo về sự thiếu đổi mới của Siri sau sự vươn lên nhanh chóng của các đối thủ cạnh tranh trong lĩnh vực trợ lý giọng nói. Tờ báo đã lưu ý rằng những thông báo về Alexa của Amazon đã gây sự chú ý đối với các nhân viên Apple. 


Vấn đề của những hệ thống “ra lệnh”


Về cơ bản A.I. Chatbot được hỗ trợ bởi kỹ thuật được gọi là mô hình ngôn ngữ lớn, là hệ thống được đào tạo để nhận dạng và tạo văn bản dựa trên tập dữ liệu khổng lồ được lấy từ web, từ đó có thể gợi ý các từ để hoàn thành một câu. Ngược lại, Siri, Alexa và Google Assistant về cơ bản là những hệ thống ra lệnh và kiểm soát. Chúng có thể hiểu một danh sách hữu hạn các câu hỏi và yêu cầu như “Thời tiết ở Thành phố New York thế nào?” hoặc "Hãy bật đèn phòng ngủ." Nếu người dùng yêu cầu trợ lý ảo làm điều gì đó không có trong mã có sẵn, thì nó chỉ nói rằng nó không thể giúp được.


Ông Burkey, người được giao nhiệm vụ cải tiến Siri vào năm 2014, cho biết Siri có một thiết kế cồng kềnh khiến việc thêm các tính năng mới trở nên tốn thời gian. Cơ sở dữ liệu của Siri chứa một danh sách khổng lồ các từ, bao gồm tên của các nghệ sĩ âm nhạc và địa điểm như nhà hàng với gần 20 ngôn ngữ. Điều đó khiến nó trở thành một trở ngại lớn nếu ai đó muốn thêm một từ ngữ nào đó vào cơ sở dữ liệu của Siri.


Google Assistant cũng gặp ý kiến về việc thu thập thông tin nhạy cảm về người dùng


Ông Burkey cho biết, những cập nhật có vẻ đơn giản, chẳng hạn như thêm một số cụm từ mới vào tập dữ liệu. Tuy nhiên, việc này yêu cầu việc xây dựng lại toàn bộ cơ sở dữ liệu và quá trình này có thể mất tới 6 tuần. Việc bổ sung các tính năng phức tạp hơn như các công cụ tìm kiếm mới có thể mất gần một năm. Điều đó có nghĩa là không có cách nào để Siri trở thành một trợ lý sáng tạo như ChatGPT.


Các cựu quản lý tại Amazon và Google cho biết Alexa và Google Assistant dựa trên công nghệ tương tự như Siri nhưng các công ty đã phải vật lộn để tạo ra doanh thu với thông điệp đây là phần mềm trợ lý cho người dùng. Ngược lại, Apple đã sử dụng thành công Siri để lôi kéo người mua sử dụng iPhone của mình.


Số phận của những chiếc loa thông minh


Sau khi Amazon phát hành Echo (một chiếc loa thông minh được hỗ trợ bởi Alexa) vào năm 2014, công ty hy vọng sản phẩm này sẽ giúp tăng doanh số bán hàng trên cửa hàng trực tuyến của mình bằng cách cho phép người tiêu dùng nói chuyện với Alexa để đặt hàng. Nhưng trong khi mọi người hào hứng với khả năng trả lời về thời tiết và đặt báo thức của Alexa, thì rất ít người yêu cầu Alexa đặt hàng một món hàng nào đó.


Cựu giám đốc điều hành cho biết Amazon có thể đã đầu tư quá mức vào việc sản xuất các loại phần cứng mới như đồng hồ báo thức và lò vi sóng hoạt động với Alexa. Ông cũng cho biết công ty đã đầu tư chưa đúng mức vào việc tạo ra một hệ sinh thái để mọi người dễ dàng mở rộng khả năng của trợ lý ảo này theo cách mà Apple đã làm với App Store của mình để giúp thu hút sự quan tâm đến iPhone. Mặc dù Amazon cung cấp một kho “kỹ năng” giúp Alexa kiểm soát các phụ kiện của bên thứ ba như công tắc đèn, nhưng rất khó để tìm và thiết lập các kỹ năng cho chiếc loa này. Điều này không giống như trải nghiệm tải xuống ứng dụng di động từ các cửa hàng ứng dụng mà không gặp trở ngại.


Cho đến hôm nay, hầu như người dùng không có nhiều sự phụ thuộc vào Siri và các trợ lý ảo khác như Alexa của Amazon hay Google Assistant


Carolina Milanesi, nhà phân tích công nghệ tiêu dùng của công ty nghiên cứu Creative Strategies và từng là cố vấn cho Amazon, cho biết: “Chúng tôi chưa bao giờ có một App Store dành cho các trợ lý này.” Cuối năm ngoái, bộ phận Amazon làm việc trên Alexa là một phần trong đợt sa thải 18.000 nhân viên của công ty và một số giám đốc điều hành hàng đầu của Alexa đã rời công ty. Vào tháng 1, khi công ty mẹ của Google sa thải 12.000 nhân viên, trong đó, nhóm phát triển hệ điều hành cho thiết bị gia đình đã mất 16% số kỹ sư.


Một người quản lý cũ từng làm việc trên Google Assistant cho biết sự thất vọng của Amazon với Alexa có thể đã khiến Google lạc lối. Các kỹ sư của Google đã dành nhiều năm thử nghiệm với trợ lý của mình để bắt chước những gì Alexa có thể làm, bao gồm thiết kế loa thông minh và màn hình máy tính bảng điều khiển bằng giọng nói để điều khiển các phụ kiện gia đình như bộ điều nhiệt và công tắc đèn. Sau đó, công ty đã tích hợp quảng cáo vào các sản phẩm gia dụng đó những những quảng cáo này không chuyển đổi thành nguồn doanh thu chính.


Tương lai sẽ là sự kết hợp giữa Chatbot A.I và trợ lý giọng nói


Satya Nadella, Giám đốc Điều hành của Microsoft, cho biết trong một cuộc phỏng vấn vào tháng 3 với The Financial Times rằng các trợ lý giọng nói nhàm chán như “những cục đá” và tuyên bố rằng những công cụ A.I. thế hệ mới sẽ làm chủ cuộc đua. Theo đó, Microsoft đã hợp tác chặt chẽ với OpenAI để đầu tư 13 tỷ USD trong việc tích hợp công nghệ của OpenAI vào công cụ tìm kiếm Bing cũng như các sản phẩm khác.


Theo thời gian, Google nhận ra rằng hầu hết mọi người chỉ sử dụng trợ lý giọng nói cho một số tác vụ đơn giản, chẳng hạn như bắt đầu hẹn giờ và phát nhạc. Vào năm 2020, khi Prabhakar Raghavan, Giám đốc Điều hành của Google, đã tiếp quản Google Assistant và đội ngũ của ông đã tái tập trung tính năng này như một tính năng nổi bật cho điện thoại thông minh Android.


ChatGPT vẫn có những hạn chế khi hiểu ngữ cảnh và tạo phản hồi hợp lí cho một số truy vấn nhất định


Theo The New York Times, Apple từ chối bình luận về Siri trong vấn đề này. Với Google, họ cho biết sẽ cam kết cung cấp một trợ lý ảo tuyệt vời để giúp mọi người xử lý thao tác trên điện thoại trong nhiều tình huống khác. Ngoài ra, công ty cũng đang thử nghiệm một A.I chatbot là Bard vốn được xem là câu trả lời cho cuộc đua tốn công tốn sức này. Amazon cho biết họ đã chứng kiến mức độ tương tác của khách hàng trên toàn cầu với Alexa tăng 30% trong năm ngoái và họ rất lạc quan về sứ mệnh xây dựng chiến lược A.I


Nhiều công ty công nghệ lớn hiện đang chạy đua để phản ứng với sự phát triển nhanh của ChatGPT. Tại trụ sở chính của Apple vào tháng 2/2023, công ty đã tổ chức A.I Summit, một sự kiện nội bộ để nhân viên tìm hiểu về mô hình ngôn ngữ lớn và các ứng dụng A.I. Nhiều kỹ sư, bao gồm cả các thành viên của nhóm Siri, đã thử nghiệm các khái niệm tạo ra ngôn ngữ cho A.I mỗi tuần. Trong tháng 3/2023, Google cũng cho biết họ sẽ sớm phát hành công cụ A.I giúp các doanh nghiệp, chính phủ và nhà phát triển phần mềm xây dựng các ứng dụng có thể nhúng chatbot và kết hợp công nghệ nền tảng vào hệ thống của họ.


Các chuyên gia A.I cho biết, trong tương lai, sẽ có sự kết hợp giữa công nghệ chatbot và trợ lý giọng nói. Điều đó có nghĩa là mọi người sẽ có thể điều khiển chatbot bằng giọng nói và những người sử dụng các sản phẩm của Apple, Amazon và Google sẽ có thể yêu cầu trợ lý ảo giúp họ trong công việc chứ không chỉ các tác vụ như kiểm tra thời tiết. 


Quan Dinh H.