Google Äã công bá» má»t bÆ°á»c Äá»t phá mà há» gá»i là má»t bÆ°á»c Äá» Äạt Äược mục tiêu vá» má»t mô hình AI duy nhất có thá» xá» lý nhiá»u tác vụ.
Google Äã công bá» má»t công nghá» má»i Äược gá»i là LIMoE mà theo há», nó thá» hiá»n má»t bÆ°á»c tiến tá»i viá»c Äạt Äược mục tiêu của Google vá» kiến ââtrúc AI Äược gá»i là Pathways.
Pathways là má»t kiến ââtrúc AI của Google là má»t mô hình duy nhất có thá» há»c cách thá»±c hiá»n nhiá»u nhiá»m vụ hiá»n Äang Äược thá»±c hiá»n bằng cách sá» dụng nhiá»u thuáºt toán.
LIMoE là từ viết tắt của Há»c nhiá»u phÆ°Æ¡ng thức vá»i má»t mô hình há»n hợp thÆ°a thá»t chuyên gia. Äó là má»t mô hình xá» lý tầm nhìn và vÄn bản cùng nhau.
Mặc dù có những kiến ââtrúc khác Äá» là m những viá»c tÆ°Æ¡ng tá»±, nhÆ°ng bÆ°á»c Äá»t phá nằm á» cách mô hình má»i hoà n thà nh những nhiá»m vụ nà y, bằng cách sá» dụng kỹ thuáºt mạng nÆ¡-ron gá»i là Mô hình thÆ°a thá»t.
>> Tham khảo: Google cáºp nháºt thuáºt toán lõi và o tháng 5/2022.
Mô hình thÆ°a thá»t Äược mô tả trong má»t bà i báo nghiên cứu nÄm 2017 Äã giá»i thiá»u phÆ°Æ¡ng pháp tiếp cáºn lá»p Há»n hợp của các chuyên gia (MoE), trong má»t bà i báo nghiên cứu có tiêu Äá», Mạng thần kinh lá»n vượt trá»i: Lá»p há»n hợp của các chuyên gia.
Và o nÄm 2021, Google Äã công bá» mô hình MoE có tên GLaM: Hiá»u quả má» rá»ng mô hình ngôn ngữ vá»i há»n hợp chuyên gia Äược Äà o tạo chá» trên vÄn bản.
Sá»± khác biá»t vá»i LIMoE là nó hoạt Äá»ng trên vÄn bản và hình ảnh Äá»ng thá»i.
Mô hình thÆ°a thá»t khác vá»i các mô hình âdà y Äặcâ á» chá» thay vì dà nh má»i phần của mô hình Äá» hoà n thà nh nhiá»m vụ, mô hình thÆ°a thá»t giao nhiá»m vụ cho nhiá»u âchuyên giaâ chuyên vá» má»t phần nhiá»m vụ.
Äiá»u nà y là m Äược là Äá» giảm chi phà tÃnh toán, là m cho mô hình hiá»u quả hÆ¡n.
Vì váºy, tÆ°Æ¡ng tá»± nhÆ° cách bá» não nhìn thấy má»t con chó và biết Äó là má»t con chó, rằng Äó là má»t con chó pug và con chó pug có bá» lông mà u nâu và ng bạc, mô hình nà y cÅ©ng có thá» xem má»t hình ảnh và hoà n thà nh nhiá»m vụ theo cách tÆ°Æ¡ng tá»±, bằng cách gán tÃnh toán nhiá»m vụ cho các chuyên gia khác nhau chuyên vá» nhiá»m vụ nháºn dạng má»t con chó, giá»ng chó, mà u sắc của nó, v.v.
Mô hình LIMoE Äá»nh tuyến vấn Äá» cho các âchuyên giaâ chuyên vá» má»t nhiá»m vụ cụ thá», Äạt Äược kết quả tÆ°Æ¡ng tá»± hoặc tá»t hÆ¡n so vá»i các phÆ°Æ¡ng pháp giải quyết vấn Äá» hiá»n tại.
Má»t tÃnh nÄng thú vá» của mô hình là cách má»t sá» chuyên gia chủ yếu chuyên xá» lý hình ảnh, những ngÆ°á»i khác chủ yếu chuyên xá» lý vÄn bản và má»t sá» chuyên gia chuyên là m cả hai.
Mô tả của Google vá» cách hoạt Äá»ng của LIMoE cho thấy cách thức có má»t chuyên gia vá» mắt, má»t chuyên gia khác vá» bánh xe, má»t chuyên gia vá» há»a tiết sá»c, há»a tiết rắn, từ ngữ, tay nắm cá»a, thá»±c phẩm và trái cây, biá»n và bầu trá»i và má»t chuyên gia vá» hình ảnh thá»±c váºt.
Thông báo vá» thuáºt toán má»i mô tả các chuyên gia nà y:
âCÅ©ng có má»t sá» mẫu Äá»nh tÃnh rõ rà ng giữa các chuyên gia hình ảnh – và dụ: trong hầu hết các mô hình LIMoE, có má»t chuyên gia xá» lý tất cả các bản vá hình ảnh có chứa vÄn bản. ⦠Má»t chuyên gia xá» lý Äá»ng váºt và cây xanh, và má»t chuyên gia khác xá» lý bà n tay con ngÆ°á»i. â
>> Tham khảo: Ná»i dung thá»ng kê giúp thu hút backlink chất lượng cao.
Các chuyên gia chuyên vá» các phần khác nhau của các vấn Äá» cung cấp khả nÄng má» rá»ng quy mô và hoà n thà nh chÃnh xác nhiá»u nhiá»m vụ khác nhau nhÆ°ng vá»i chi phà tÃnh toán thấp hÆ¡n.
Bà i báo nghiên cứu tóm tắt những phát hiá»n của há»:
âChúng tôi Äá» xuất LIMoE, mô hình chuyên gia há»n hợp Äa phÆ°Æ¡ng thức quy mô lá»n Äầu tiên.
Chúng tôi chứng minh chi tiết cách các phÆ°Æ¡ng pháp tiếp cáºn chÃnh quy hóa mô hình há»n hợp chuyên gia không phù hợp vá»i há»c táºp Äa phÆ°Æ¡ng thức và Äá» xuất má»t sÆ¡ Äá» chÃnh quy hóa dá»±a trên entropy má»i Äá» á»n Äá»nh Äà o tạo.
Chúng tôi cho thấy rằng LIMoE tá»ng quát trên các quy mô kiến ââtrúc, vá»i những cải tiến tÆ°Æ¡ng Äá»i vá» Äá» chÃnh xác của ImageNet khi không chụp, từ 7% Äến 13% so vá»i các mô hình có máºt Äá» tÆ°Æ¡ng ÄÆ°Æ¡ng.
Äược má» rá»ng hÆ¡n nữa, LIMoE-H / 14 Äạt Äược Äá» chÃnh xác của ImageNet là 84,1%, có thá» so sánh vá»i các mô hình tÆ°Æ¡ng phản SOTA vá»i xÆ°Æ¡ng sá»ng theo phÆ°Æ¡ng thức và Äà o tạo trÆ°á»c. â
1. Phù hợp vá»i trạng thái nghá» thuáºt
Có rất nhiá»u bà i báo nghiên cứu Äược xuất bản hà ng tháng. NhÆ°ng chá» má»t sá» Ãt Äược Google AI Äánh dấu.
Thông thÆ°á»ng, nghiên cứu của Google gây chú ý vì nó Äạt Äược Äiá»u gì Äó má»i mẻ, ngoà i viá»c Äạt Äược trạng thái hiá»n Äại.
LIMoE hoà n thà nh kỳ tÃch nà y là Äạt Äược kết quả tÆ°Æ¡ng ÄÆ°Æ¡ng vá»i các thuáºt toán tá»t nhất hiá»n nay nhÆ°ng hiá»u quả hÆ¡n.
Các nhà nghiên cứu nêu báºt lợi thế nà y:
âVá» phân loại ảnh zero-shot, LIMoE vượt trá»i hÆ¡n cả các mô hình Äa phÆ°Æ¡ng thức và phÆ°Æ¡ng pháp tiếp cáºn hai tháp có máºt Äá» tÆ°Æ¡ng ÄÆ°Æ¡ng.
LIMoE lá»n nhất Äạt Äược Äá» chÃnh xác 84,1% của ImageNet khi chụp không ảnh, có thá» so sánh vá»i các mẫu máy ảnh hiá»n Äại Äắt tiá»n hÆ¡n.
Sá»± thÆ°a thá»t cho phép LIMoE má» rá»ng quy mô má»t cách duyên dáng và há»c cách xá» lý các Äầu và o rất khác nhau, giải quyết sá»± cÄng thẳng giữa viá»c trá» thà nh má»t nhà tá»ng quát hóa Äa ngà nh nghá» và má»t chuyên gia báºc thầy. â
Các kết quả thà nh công của LIMoE khiến các nhà nghiên cứu nháºn thấy rằng LIMoE có thá» là má»t con ÄÆ°á»ng phÃa trÆ°á»c Äá» Äạt Äược má»t mô hình tá»ng quát Äa phÆ°Æ¡ng thức.
Các nhà nghiên cứu Äã quan sát:
âChúng tôi tin rằng khả nÄng xây dá»±ng má»t mô hình tá»ng quát vá»i các thà nh phần chuyên biá»t, có thá» quyết Äá»nh cách các phÆ°Æ¡ng thức hoặc nhiá»m vụ khác nhau nên tÆ°Æ¡ng tác, sẽ là chìa khóa Äá» tạo ra các mô hình Äa nhiá»m thá»±c sá»± vượt trá»i vá» má»i thứ há» là m.
LIMoE là má»t bÆ°á»c Äầu tiên Äầy hứa hẹn theo hÆ°á»ng Äó. â
>> Tham khảo: Facebook cÆ¡ cấu lại nguá»n cấp dữ liá»u vá»i ná»i dung video.
2. Những thiếu sót tiá»m ẩn, thà nh kiến ââvà các vấn Äá» Äạo Äức khác
Có những thiếu sót Äá»i vá»i kiến ââtrúc nà y không Äược thảo luáºn trong thông báo của Google nhÆ°ng Äược Äá» cáºp trong chÃnh tà i liá»u nghiên cứu.
Bà i báo nghiên cứu lÆ°u ý rằng, tÆ°Æ¡ng tá»± nhÆ° các mô hình quy mô lá»n khác, LIMoE cÅ©ng có thá» ÄÆ°a ra các thà nh kiến ââvà o kết quả.
Các nhà nghiên cứu nói rằng há» vẫn chÆ°a “giải quyết má»t cách rõ rà ng” các vấn Äá» vá»n có trong các mô hình quy mô lá»n.
HỠviết:
âNhững tác hại tiá»m ẩn của các mô hình quy mô lá»nâ¦, các mô hình tÆ°Æ¡ng phản⦠và dữ liá»u Äa phÆ°Æ¡ng thức quy mô web⦠cÅ©ng mang lại á» Äây, vì LIMoE không giải quyết chúng má»t cách rõ rà ng.â
Tuyên bá» trên tham chiếu (trong má»t liên kết chú thÃch) Äến má»t bà i báo nghiên cứu nÄm 2021 có tên là Vá» cÆ¡ há»i và rủi ro của các mô hình ná»n tảng (PDF tại Äây).
Bà i báo nghiên cứu từ nÄm 2021 Äó cảnh báo cách các công nghá» Google AI má»i ná»i có thá» gây ra tác Äá»ng tiêu cá»±c Äến xã há»i nhÆ°:
â⦠Sá»± không công bằng, lạm dụng, tác Äá»ng kinh tế và môi trÆ°á»ng, các cân nhắc vá» luáºt pháp và Äạo Äức.â
Theo bà i báo Äược trÃch dẫn, các vấn Äá» Äạo Äức cÅ©ng có thá» nảy sinh từ xu hÆ°á»ng Äá»ng nhất hóa các nhiá»m vụ, sau Äó có thá» dẫn Äến má»t Äiá»m thất bại sau Äó Äược tái tạo cho các nhiá»m vụ khác tiếp theo.
Tà i liá»u nghiên cứu cảnh báo nêu rõ:
âà nghÄ©a của các mô hình ná»n tảng có thá» Äược tóm tắt bằng hai từ: sá»± xuất hiá»n và sá»± Äá»ng nhất.
Sá»± ná»i lên có nghÄ©a là hà nh vi của má»t há» thá»ng Äược tạo ra má»t cách ngầm Äá»nh chứ không phải Äược xây dá»±ng má»t cách rõ rà ng; nó vừa là nguá»n gá»c của sá»± phấn khÃch khoa há»c và sá»± lo lắng vá» những háºu quả không lÆ°á»ng trÆ°á»c Äược.
Äá»ng nhất hóa chá» ra sá»± hợp nhất các phÆ°Æ¡ng pháp luáºn Äá» xây dá»±ng há» thá»ng há»c máy trên nhiá»u ứng dụng; nó cung cấp Äòn bẩy mạnh mẽ Äá»i vá»i nhiá»u nhiá»m vụ nhÆ°ng cÅ©ng tạo ra những Äiá»m thất bại ÄÆ¡n lẻ. â
Má»t lÄ©nh vá»±c cần tháºn trá»ng là AI liên quan Äến thá» giác.
>> Tham khảo: Mất bao lâu Äá» thấy kết quả từ viá»c xây dá»±ng liên kết?
Báo cáo nÄm 2021 tuyên bá» rằng sá»± phá» biến của camera có nghÄ©a là bất kỳ tiến bá» nà o trong AI liên quan Äến tầm nhìn Äá»u có thá» mang lại rủi ro Äá»ng thá»i Äá»i vá»i công nghá» Äang Äược áp dụng theo cách không lÆ°á»ng trÆ°á»c Äược có thá» có “tác Äá»ng gián Äoạn”, bao gá»m cả liên quan Äến quyá»n riêng tÆ° và giám sát.
Má»t cảnh báo tháºn trá»ng khác liên quan Äến những tiến bá» trong AI của Google liên quan Äến thá» lá»±c là các vấn Äá» vá» Äá» chÃnh xác và Äá» chá»ch.
HỠlưu ý:
âCó má»t lá»ch sá» Äược ghi chép Äầy Äủ vá» sá»± sai lá»ch Äã há»c Äược trong các mô hình thá» giác máy tÃnh, dẫn Äến Äá» chÃnh xác thấp hÆ¡n và các lá»i tÆ°Æ¡ng quan cho các nhóm Äược trình bà y Ãt, do Äó viá»c triá»n khai sá»m và không phù hợp Äá»i vá»i má»t sá» cà i Äặt trong thế giá»i thá»±c.â
Phần còn lại của bà i báo ghi lại cách các công nghá» Google AI có thá» tìm hiá»u các thà nh kiến ââhiá»n có và duy trì sá»± bất bình Äẳng.
âCác mô hình tá» chức có khả nÄng mang lại những kết quả bất bình Äẳng: Äá»i xá» bất công vá»i những ngÆ°á»i không công bằng, Äặc biá»t là do sá»± phân bá» không Äá»ng Äá»u dá»c theo các ÄÆ°á»ng dẫn Äến sá»± phân biá»t Äá»i xá» trong lá»ch sá»â¦. Giá»ng nhÆ° bất kỳ há» thá»ng AI nà o, các mô hình ná»n tảng có thá» tạo ra các bất bình Äẳng hiá»n có bằng cách tạo ra các kết quả không công bằng, cá» thủ các há» thá»ng quyá»n lá»±c và phân phá»i má»t cách không cân Äá»i các háºu quả tiêu cá»±c của công nghá» cho những ngÆ°á»i Äã bá» gạt ra ngoà i lá» xã há»i⦠â
Các nhà nghiên cứu của LIMoE lÆ°u ý rằng mô hình cụ thá» nà y có thá» giải quyết má»t sá» thà nh kiến ââchá»ng lại các nhóm không Äược trình bà y vì bản chất của cách các chuyên gia chuyên vá» má»t sá» thứ nhất Äá»nh.
Những loại kết quả tiêu cá»±c nà y không phải là lý thuyết, chúng là thá»±c tế và Äã tác Äá»ng tiêu cá»±c Äến cuá»c sá»ng trong các ứng dụng trong thế giá»i thá»±c, chẳng hạn nhÆ° thà nh kiến ââkhông công bằng dá»±a trên chủng tá»c do các thuáºt toán tuyá»n dụng viá»c là m ÄÆ°a ra.
Các tác giả của bà i báo LIMoE thừa nháºn những thiếu sót tiá»m ẩn Äó trong má»t Äoạn ngắn, coi nhÆ° má»t cảnh báo trÆ°á»c.
NhÆ°ng há» cÅ©ng lÆ°u ý rằng có thá» có khả nÄng giải quyết má»t sá» thà nh kiến ââvá»i cách tiếp cáºn má»i nà y.
HỠviết:
â⦠Khả nÄng má» rá»ng quy mô mô hình vá»i các chuyên gia có thá» chuyên sâu có thá» mang lại hiá»u suất tá»t hÆ¡n cho các nhóm Ãt Äược Äại diá»n.â
Cuá»i cùng, má»t thuá»c tÃnh quan trá»ng của công nghá» má»i nà y cần Äược lÆ°u ý là không có công dụng rõ rà ng nà o Äược nêu cho nó.
Nó chá» ÄÆ¡n giản là má»t công nghá» có thá» xá» lý hình ảnh và vÄn bản má»t cách hiá»u quả.
Là m thế nà o nó có thá» Äược áp dụng, nếu nó Äã từng Äược áp dụng trong biá»u mẫu nà y hoặc má»t biá»u mẫu trong tÆ°Æ¡ng lai, không bao giá» Äược giải quyết.
Và Äó là má»t yếu tá» quan trá»ng Äược ÄÆ°a ra bá»i tà i liá»u cảnh báo (CÆ¡ há»i và rủi ro của các mô hình ná»n tảng), kêu gá»i sá»± chú ý Äến viá»c các nhà nghiên cứu tạo ra các khả nÄng cho Google AI mà không xem xét cách chúng có thá» Äược sá» dụng và tác Äá»ng của chúng Äá»i vá»i các vấn Äá» nhÆ° quyá»n riêng tÆ° và Bảo vá».
âCác mô hình ná»n tảng là các tà i sản trung gian không có mục ÄÃch cụ thá» trÆ°á»c khi chúng Äược Äiá»u chá»nh; hiá»u Äược tác hại của chúng Äòi há»i phải có lý luáºn vá» cả Äặc tÃnh của chúng và vai trò của chúng trong viá»c xây dá»±ng các mô hình nhiá»m vụ cụ thá» â.
Tất cả những lÆ°u ý Äó không nằm trong bà i báo thông báo của Google nhÆ°ng Äược tham chiếu trong phiên bản PDF của chÃnh bà i báo nghiên cứu.
3. Kiến trúc AI & LIMoE Pathways
VÄn bản, hình ảnh, dữ liá»u âm thanh Äược gá»i là các phÆ°Æ¡ng thức, các loại dữ liá»u khác nhau hoặc chuyên môn hóa nhiá»m vụ, có thá» nói nhÆ° váºy. PhÆ°Æ¡ng thức cÅ©ng có thá» có nghÄ©a là ngôn ngữ nói và ký hiá»u.
Vì váºy, khi bạn nhìn thấy cụm từ “Äa phÆ°Æ¡ng thức” hoặc “phÆ°Æ¡ng thức” trong các bà i báo khoa há»c và tà i liá»u nghiên cứu, những gì há» thÆ°á»ng nói Äến là các loại dữ liá»u khác nhau.
Mục tiêu cuá»i cùng của Google Äá»i vá»i AI là cái mà nó gá»i là Kiến trúc AI thế há» tiếp theo của Pathways.
Pathways thá» hiá»n sá»± chuyá»n hÆ°á»ng từ các mô hình há»c máy là m má»t viá»c thá»±c sá»± tá»t (do Äó Äòi há»i hà ng nghìn ngÆ°á»i trong sá» há») sang má»t mô hình duy nhất thá»±c hiá»n má»i thứ thá»±c sá»± tá»t.
Pathways (và LIMoE) là má»t cách tiếp cáºn Äa phÆ°Æ¡ng thức Äá» giải quyết vấn Äá».
Nó Äược mô tả nhÆ° thế nà y:
âCon ngÆ°á»i dá»±a và o nhiá»u giác quan Äá» nháºn thức thế giá»i. Äiá»u Äó rất khác vá»i cách các há» thá»ng AI hiá»n Äại tiêu hóa thông tin.
Hầu hết các mô hình ngà y nay chá» xá» lý má»t phÆ°Æ¡ng thức thông tin tại má»t thá»i Äiá»m. Há» có thá» lấy vÄn bản, hình ảnh hoặc lá»i nói – nhÆ°ng thÆ°á»ng không phải cả ba cùng má»t lúc.
Các lá» trình có thá» cho phép các mô hình Äa phÆ°Æ¡ng thức bao gá»m sá»± hiá»u biết vá» thá» giác, thÃnh giác và ngôn ngữ Äá»ng thá»i â.
Äiá»u là m cho LIMoE trá» nên quan trá»ng là nó là má»t kiến ââtrúc Äa phÆ°Æ¡ng thức Äược các nhà nghiên cứu gá»i là â⦠bÆ°á»c quan trá»ng Äá»i vá»i tầm nhìn Pathwaysâ¦â
Các nhà nghiên cứu mô tả LIMoE là má»t âbÆ°á»câ vì còn nhiá»u viá»c phải là m, bao gá»m viá»c khám phá cách tiếp cáºn nà y có thá» hoạt Äá»ng vá»i các phÆ°Æ¡ng thức không chá» là hình ảnh và vÄn bản.
Bà i báo nghiên cứu nà y và bà i viết tóm tắt Äi kèm cho biết hÆ°á»ng nghiên cứu AI của Google Äang Äi và cách nó Äến Äược Äó.