[AI_Stories] Google hiện đang có những dự án TRÍ TUỆ NHÂN TẠO nào?

Alphabet là một tập đoàn đa quốc gia về dịch vụ internet, công nghệ và khoa học đời sống có trụ sở chính tại Mỹ. Các công ty con bao gồm “gã tìm kiếm khổng lồ” Google, công ty khoa học đời sống Verily, công ty chuyên về công nghệ xe tự lái Waymo, công ty sản xuất thiết bị nhà thông minh Nest, công ty trí tuệ nhân tạo Deep Mind, và một số những công ty khác.

Trong bức thư gửi các nhà đầu tư vào năm 2017, Serge Brin, chủ tịch của Alphabet, đã viết: “Mùa xuân mới của trí tuệ nhân tạo chính là bước phát triển quan trọng bậc nhất của toàn ngành công nghệ máy tính trong thời đại này”. Tuyên bố này được cho là tính cả đến sự xuất hiện của Internet, vì vậy lập luận đó chắc chắn không thể bị xem nhẹ.

Alphabet hiểu được tiềm năng của AI và đã thiết lập để sử dụng nó cho các mảng kinh doanh của mình, bao gồm từ việc cải thiện khả năng tìm kiếm trên internet, cho đến công nghệ xe tự lái, nhà tự động, trợ lý ảo thông minh, dịch thuật ngôn ngữ và khoa học y tế cứu sinh.

Alphabet đã sử dụng trí tuệ nhân tạo như thế nào?

SMARTER SEARCHING
Công cụ tìm kiếm thông minh của Google có nhiều người sử dụng nhất trên thế giới – được tích hợp chặt chẽ với AI. Dù bạn tìm kiếm bằng văn bản, giọng nói hay hình ảnh, thì mọi câu lệnh hiện nay đều được xử lý bởi các hệ thống thông minh và tự học hỏi (ít nhất là từ năm 2015 chúng ta đã được trải nghiệm điều này thông qua hệ thống tìm kiếm Rankbrain của Google).

Cả tìm kiếm bằng văn bản và giọng nói đều sử dụng quy trình xử lý ngôn ngữ tự nhiên (NLP), vì vậy các thuật toán cố gắng “hiểu” cách mỗi từ bạn nhập như một phần của một lệnh tìm kiếm có sự liên quan giữa các từ được sử dụng, thay vì chỉ xem xét nghĩa của mỗi từ một cách đơn lẻ. Đây chính là cách phân tích ngữ nghĩa – chìa khóa cho quy trình xử lý ngôn ngữ tự nhiên.

Chức năng tìm kiếm hình ảnh của Google sử dụng thị giác máy tính (computer vision) để nhận diện nội dung dữ liệu hình ảnh được Google phân loại và sắp xếp để người dùng có thể tìm kiếm chúng bằng văn bản hoặc giọng nói. Các thuật toán Deep Learning cho phép công nghệ này ngày càng trở nên tốt hơn trong việc nhận biết và dán nhãn các yếu tố khác nhau có trong hình ảnh. Càng tiếp xúc với nhiều hình ảnh đa dạng, khả năng tìm kiếm bằng hình ảnh của Google càng nhận biết rõ hơn và trở nên chính xác hơn.

Một khi AI của Google đã xử lý lệnh tìm kiếm của bạn và quyết định những gì nó nghĩ là bạn thực sự muốn, nó sẽ bắt đầu đối chiếu với thư mục nội dung trực tuyến của mình – trang web, hình ảnh, video và tài liệu. Những nội dung này cũng đã được xử lý bởi các hệ thống Machine Learning.

Những hệ thống này được đào tạo để sắp xếp, xếp hạng và lọc tất cả nội dung trong thư mục của mình. Nội dung được đánh giá bởi mức độ thường xuyên được trích dẫn (được liên kết), tính chính xác của thông tin chứa trong đó, khả năng thông tin có thể là spam hoặc quảng cáo và liệu nó có khả năng là dữ liệu bất hợp pháp hay vi phạm bản quyền hay không.

Điều này có nghĩa là một tìm kiếm dù đơn giản của Google cũng liên quan đến rất nhiều tính toán AI phức tạp. Khả năng xây dựng các hệ thống có thể xử lý hàng tỷ phép tính mỗi ngày từ khắp nơi trên thế giới là điều đã biến Alphabet và Google trở thành gã khổng lồ thực sự trong lĩnh vực AI (cũng như là một trong những công ty giàu nhất thế giới).

Google sử dụng AI cho nhiều ứng dụng chủ chốt khác của mình, bao gồm các biện pháp bảo mật – giúp giữ an toàn cho tài khoản Gmail và Adwords – cho phép doanh nghiệp thanh toán cho các quảng cáo của họ xuất hiện trong các tìm kiếm của các khách hàng tiềm năng (có thể quan tâm).

TRỢ LÝ CÁ NHÂN ẢO
Trợ lý cá nhân ảo tích hợp AI sử dụng công nghệ nhận diện giọng nói đã xuất hiện vài năm nay và Google Home, Amazon Alexa, Apple Siri chính là những cái tên tiêu biểu, quen thuộc với hầu hết chúng ta.

Mặc dù những ứng dụng đầu tiên của công nghệ NLP vào các thiết bị tiêu dùng có vẻ ấn tượng so với những gì chúng ta thấy chỉ một vài năm trước đây, bất kỳ ai đã sử dụng một trong những ứng dụng này sẽ biết rằng chúng có những hạn chế. Chúng có thể đáp ứng tốt với các câu và mệnh lệnh cơ bản và tương đối ngắn, nhưng hãy thử nói chuyện với các ứng dụng này như một con người thực sự và những hạn chế sẽ bắt đầu xuất hiện.

Điều này là do, về mặt phát triển con người mà nói, những công nghệ này vẫn còn ở giai đoạn “trẻ sơ sinh”. Nói một cách đơn giản, chúng chưa có đủ dữ liệu. Điều này đang thay đổi nhanh chóng và công nghệ Duplex của Google đang dẫn dắt cuộc chơi.

Duplex có thể cho ra đời các cuộc hội thoại tự nhiên hơn, ít bị ngắt quãng hơn. Điều này là do nó được huấn luyện đặc biệt cho các tình huống cụ thể và các thuật toán của nó chuyên về thu thập dữ liệu có liên quan đến các tình huống đó. Một ví dụ được Google sử dụng để giới thiệu tính năng này là khi Duplex thực hiện cuộc gọi đặt lịch hẹn tại một tiệm làm tóc thay cho người dùng. Trong các trường hợp sử dụng tương đối được kiểm soát và hạn chế ngữ cảnh như thế này, Duplex đã đạt đến rất gần với khả năng hiển thị như một con người thật sự.

Một thủ thuật được các kỹ sư của Google sử dụng để làm cho máy phát ra âm thanh giống người hơn là chính kết hợp các yếu tố ngẫu nhiên trong các mẫu giọng nói của chúng ta. Chẳng hạn, máy sẽ thốt ra các từ như “umm”, “aah” hay “mhhmm” ở những tình huống mà con người thường nói ra một cách tự nhiên.

DỊCH THUẬT NGÔN NGỮ

Nhờ công nghệ Machine Learning, giờ đây bạn có thể dạy máy tính nói một ngôn ngữ, và rồi nó sẽ tự dạy mình nói bất kỳ ngôn ngữ nào khác. Đó là nguyên tắc đằng sau dịch vụ Google Translate, sử dụng công nghệ Deep Learning để giúp máy tính biến các ngôn ngữ thành những khối nền tảng cơ bản nhất.

Google Translate sử dụng công nghệ Deep Learning (mà cụ thể là mạng nơ-ron nhân tạo sâu) để liên tục tinh chỉnh các thuật toán của mình khi người dùng tiếp xúc với nhiều ngôn ngữ hơn. Điều này có nghĩa là nó trở nên ngày càng chính xác hơn trong việc tự hoàn thiện bản dịch. Google thậm chí đã tích hợp tính năng này vào tai nghe Pixel Bud có hỗ trợ Google Assistant, đồng nghĩa với việc người dùng có thể nhận được các bản dịch trực tiếp thông qua tai nghe của họ.

XE TỰ LÁI

Waymo, công ty con của Alphabet – sở hữu một trong những nền tảng xe tự lái hiện đại nhất trên thế giới, gần đây đã trở thành đơn vị đầu tiên cung cấp các chuyến đi có sẵn ra thị trường.

Alphabet đã đi rất xa trên con đường phát triển các phương tiện riêng của mình, chúng được tự động hóa đến mức thậm chí còn không cần đến cả vô lăng hoặc bất kỳ điều khiển lái xe nào. Được thiết kế cho một thời đại mới của việc di chuyển trong đô thị, nơi quyền sở hữu xe hơi thường đắt đỏ và bất tiện, dịch vụ của Waymo nhắm đến các mạng lưới chia sẻ chuyến đi – được dự đoán sẽ thay thế cho mạng lưới giao thông trong các thành phố thông minh trong tương lai gần.

TỰ ĐỘNG TẠO RA PHỤ ĐỀ CHO HÀNG TRIỆU VIDEO

Bên cạnh lời nói, hệ thống sử dụng các mạng nơ-ron nhân tạo sâu (deep neural networks) để xác định âm thanh xung quanh, bao gồm tiếng vỗ tay, âm nhạc, tiếng cười và tự động hiển thị văn bản cho người xem biết âm thanh nào đang diễn ra.

Google cũng sử dụng Machine Learning trong việc học hỏi các thuật toán ngôn ngữ tự nhiên để tự động tạo phụ đề cho những người có vấn đề với việc nghe (hoặc những người ai yêu thích sự thanh bình và tĩnh lặng) cho các video trên dịch vụ phát video trực tuyến YouTube.

CHUẨN ĐOÁN BỆNH
Công nghệ AI (đặc biệt là Deep Learning) của Alphabet cũng đã được triển khai rộng rãi trong lĩnh vực y tế. Một đột phá gần đây liên quan đến việc chẩn đoán tình trạng mắt. Đối với trường hợp này, nó áp dụng các thuật toán học tập để quét hồng ngoại 3D của nhãn cầu – hay còn được gọi là công nghệ chụp cắt lớp kết hợp quang học.

Hệ thống này dựa trên hai thuật toán Deep Learning, một trong số đó xây dựng bản đồ chi tiết về cấu trúc mắt và tìm hiểu thế nào là cấu trúc bình thường và đâu là dấu hiệu của những vấn đề như thoái hóa điểm vàng ở người cao tuổi. Thuật toán còn lại đưa ra những chẩn đoán dựa trên dữ liệu y tế và cung cấp sự hỗ trợ cho các chuyên gia trong việc chẩn đoán và điều trị bệnh.

GOOGLE BRAIN

Bộ phận nghiên cứu AI của Google được gọi là Google Brain. Nó được thành lập bởi 2 thành viên của Google – Jeff Dean và Greg Corrado cùng với Andrew Ng của Đại học Stanford vào năm 2011. Những đóng góp của bộ ba này đã giúp họ trở thành những nhà tiên phong của làn sóng công nghệ AI thực tiễn hiện nay.

Google Brain nhận ra rằng các mạng lưu trữ cực lớn và cực nhanh mà nó đã xây dựng, cũng như lượng dữ liệu khổng lồ truyền qua internet (và theo đó là các máy chủ), là chìa khóa để mở ra tiềm năng của Machine Learning và Deep Learning.

Kể từ khi được thành lập, nhóm này đã chịu trách nhiệm phát triển nhiều công nghệ cốt lõi, như thị giác máy tính và NLP nhằm thúc đẩy làn sóng áp dụng AI trong kinh doanh hiện nay.

DEEP MIND
Một “vũ khí” quan trọng khác trong kho tàng AI của Alphabe chính là công ty Deep Mind, được mua lại vào năm 2014. Công ty khởi nghiệp của Anh này chuyên xây dựng những mạng lưới thần kinh “giả lập” dựa vào não người – được đào tạo để có thể chơi các trò chơi. Việc tập trung vào trò chơi đã cho phép các nhà nghiên cứu Deep Mind, nghiên cứu cách thức bộ não giải quyết các vấn đề nhận thức khác nhau và sử dụng dữ liệu đó để chế tạo các cỗ máy có khả năng giải quyết vấn đề theo cách tương tự. Công nghệ này đã trở thành tiêu điểm vào năm 2016 khi nó đứng sau thành công của chiếc máy tính đầu tiên có khả năng đánh bại một kì thủ cờ vây chuyên nghiệp.

Ngày nay, công nghệ AI do Deep Mind phát triển cung cấp cho một số ứng dụng thông minh của Alphabet các khả năng quan trọng, bao gồm việc tối ưu hóa hiệu quả của máy làm mát trong trung tâm dữ liệu và quản lý thời lượng pin trên các thiết bị di động chạy hệ điều hành Android. Nó cũng là “bộ não” đằng sau công nghệ chuẩn đoán mắt trong ứng dụng chăm sóc sức khỏe được đề cập ở trên.

Những thách thức và các bài học chính rút ra
• Alphabet và Google tin tưởng rất rõ ràng rằng AI chính là bệ phóng sẽ thúc đẩy làn sóng công nghệ máy tính tiếp theo.
• Cũng như vậy, họ tin rằng tác động xã hội của làn sóng tiếp theo này sẽ còn lớn hơn cả những đợt sóng trước đó – bao gồm cả sự phát triển của internet.
• Có nhiều dữ liệu hơn bất kỳ ai là một lợi thế cực kì lớn, cho phép Alphabet tiếp tục phát triển các dịch vụ dẫn đầu – từ việc tìm kiếm, phục vụ quảng cáo, dịch thuật ngôn ngữ, xử lý lời nói, nhà thông minh cho đến lái xe tự động.
• Có cơ sở hạ tầng cần thiết để di chuyển dữ liệu và khả năng xử lý để truy vấn và truy cập chúng với tốc độ cực nhanh là điều cần thiết cho công cụ tìm kiếm của Google, cũng chính là cơ sở cho phép Google áp dụng lên các ứng dụng AI khác nhau.
• Ở giai đoạn Alphabet có thể thấy được sự phát triển đột phá của mình trong lĩnh vực AI, chẳng hạn như Deep Learning, bởi các nhóm nghiên cứu và các công ty start-up, Google đã sử dụng các nguồn lực tài chính của mình để đưa những công nghệ này vào nghiên cứu và bổ sung kiến thức chuyên môn của mình cho những dự án này.

ứng dụng trí tuệ nhân tạo để dẫn đầu

Leave a Reply