“อาลีบาบา” เปิดตัว Qwen 2.5 เอไอใหม่ ท้าชน DeepSeek-V3
“อาลีบาบา” เปิดตัว Qwen 2.5 เอไอรุ่นใหม่ เครมประสิทธิภาพแซงหน้า DeepSeek โมเดล V3 สร้างแรงกระตุ้นการแข่งขันอัปเกรดโมเดล AI ภายในประเทศ
ผู้สื่อข่าวรายงาน วันนี้ (29 ม.ค. 68) อาลีบาบา (Alibaba) ยักษ์ใหญ่แห่งวงการเทคโนโลยีจีนเปิดตัวโมเดลปัญญาประดิษฐ์ (AI) Qwen 2.5 รุ่นใหม่ในวันนี้ โดยอ้างว่ามีประสิทธิภาพเหนือกว่า DeepSeek-V3 ซึ่งได้รับการชื่นชมเป็นอย่างมาก
โดยจังหวะเวลาในการเปิดตัว Qwen 2.5-Max ในวันแรกของ เทศกาลตรุษจีน ซึ่งเป็นช่วงที่คนจีนส่วนใหญ่ใช้เวลาพักผ่อนอยู่กับครอบครัวนั้น บ่งบอกถึงแรงกดดันจากการผงาดขึ้นมาของ ดีปซีค (DeepSeek) สตาร์ตอัป AI สัญชาติจีนในช่วง 3 สัปดาห์ที่ผ่านมา ซึ่งไม่เพียงสร้างแรงสั่นสะเทือนให้กับคู่แข่งต่างชาติ แต่ยังรวมถึงคู่แข่งในประเทศด้วย
ขณะที่ หน่วยธุรกิจคลาวด์ของอาลีบาบาประกาศผ่านบัญชีวีแชทอย่างเป็นทางการว่า Qwen 2.5-Max มีประสิทธิภาพเหนือกว่า GPT-4o, DeepSeek-V3 และ Llama-3.1-405B แทบทุกด้าน โดยเปรียบเทียบกับโมเดล AI แบบโอเพนซอร์สที่ก้าวล้ำที่สุดของโอเพนเอไอ (OpenAI) และเมตา แพลตฟอร์มส์ (MetaPlatforms)
สำนักข่าวรอยเตอร์ รายงานว่า DeepSeek ทำให้ซิลิคอนวัลเลย์สะเทือน หลังเปิดตัวผู้ช่วย AI ที่ใช้โมเดล DeepSeek-V3 เมื่อวันที่ 10 ม.ค. และตามมาด้วยโมเดล R1 เมื่อ 20 ม.ค. จนส่งผลให้หุ้นเทคโนโลยีร่วงลงอย่างหนัก เนื่องจาก DeepSeek ใช้ต้นทุนการพัฒนาและพลังงานต่ำกว่าคู่แข่ง ซึ่งทำให้นักลงทุนเริ่มตั้งคำถามถึงความคุ้มค่าของแผนการทุ่มเงินมหาศาลของบริษัท AI ยักษ์ใหญ่ในสหรัฐฯ
นอกจากนี้ ความสำเร็จของ DeepSeek ยังได้จุดชนวนให้เกิดการแข่งขันอย่างเร่งด่วนในการอัปเกรดโมเดล AI ของคู่แข่งภายในประเทศ
ทั้งนี้ เพียง 2 วันหลังจากการเปิดตัวโมเดล DeepSeek-R1 ไบต์แดนซ์ (ByteDance) ซึ่งเป็นเจ้าของติ๊กต๊อก (TikTok) ก็ได้ปล่อยอัปเดตโมเดล AI ตัวเอก พร้อมเคลมว่า มีประสิทธิภาพเหนือกว่าโมเดล o1 ของโอเพนเอไอที่ไมโครซอฟท์หนุนหลัง ในการทดสอบ AIME ซึ่งเป็นการวัดความสามารถของโมเดล AI ในด้านความเข้าใจและการตอบสนองต่อคำสั่งที่ซับซ้อน
โดย DeepSeek เป็นบริษัทด้านปัญญาประดิษฐ์จากประเทศจีน ก่อตั้งขึ้นในเดือนกรกฎาคม ปี 2023 โดย เหลียง เวินเฟิง (Liang Wenfeng) ศิษย์เก่าจากมหาวิทยาลัยเจ้อเจียง บริษัทนี้ได้รับการสนับสนุนจากกองทุน High-Flyer ซึ่งก่อตั้งโดยเหลียงในปี 2015 และมีบทบาทสำคัญในการรวบรวมทรัพยากรในการประมวลผลขั้นสูงเพื่อพัฒนาเทคโนโลยี AI
ขณะที่ DeepSeek V3 เป็นโมเดล AI รุ่นพี่ในตระกูล DeepSeek ซึ่งมีขนาดและประสิทธิภาพสูงกว่า DeepSeek R1 รุ่นล่าสุด โมเดล V3 ถูกออกแบบให้สามารถวิเคราะห์เชิงเหตุผลและแก้ปัญหาที่ซับซ้อนได้อย่างมีขั้นตอน ขณะที่ R1 เน้นที่ความเร็วและความคล่องตัวในการใช้งานที่สูงกว่า แม้ว่า V3 จะมีประสิทธิภาพดีกว่า R1 ในด้านการประยุกต์ใช้งานที่หลากหลาย โดยเฉพาะในงานวิจัยและการพัฒนาเครื่องมือ AI อื่น ๆ
ทั้งนี้ หากเปรียบเทียบกับ GPT ของ OpenAI, DeepSeek V3 จะคล้ายกับ GPT-4 ในขณะที่ DeepSeek R1 จะมีลักษณะคล้าย GPT-4o ซึ่งเน้นที่ความเร็วและการตอบสนองที่เร็วกว่า