Midjourney ยกระดับจากภาพนิ่งสู่วิดีโอด้วยโมเดล V1 “Image-to-Video” กดปุ่มเดียวก็ขยับภาพได้ทันที พร้อมตัวเลือกปรับท่าทาง กล้อง และความเร็วของฉากตามใจผู้ใช้.
OpenAI เปิดตัวฟีเจอร์ ChatGPT Record สำหรับผู้ใช้ macOS ในแพ็กเกจ Enterprise, Edu, Team และ Pro เพื่อบันทึกเสียงและสรุปข้อมูลในการสนทนาอย่างชาญฉลาด
OpenAI เปิดคู่มือสร้างเซิร์ฟเวอร์ MCP สำหรับเชื่อมต่อความรู้จากองค์กรเข้าสู่ ChatGPT ผ่านการค้นหาเชิงลึกแบบกำหนดเอง พร้อมตัวอย่างและมาตรฐานการพัฒนา
The Browser Company เปิดตัว Dia เบราว์เซอร์ใหม่ที่วาง AI เป็นศูนย์กลางการใช้งาน ช่วยค้นหาข้อมูล วางแผน และโต้ตอบกับเว็บได้อัจฉริยะยิ่งขึ้น
Bing เปิดตัวฟีเจอร์ใหม่ Bing Video Creator ให้ผู้ใช้สร้างวิดีโอสั้นจากข้อความได้ฟรีผ่านแอปมือถือและบน Copilot Search โดยใช้เทคโนโลยี Sora ช่วยเปลี่ยนไอเดียเป็นคลิปวิดีโอในไม่กี่วินาที
Anthropic เปิดซอร์สเครื่องมือใหม่สำหรับวิเคราะห์กระบวนการคิดภายในของโมเดลภาษา ด้วยกราฟการระบุแหล่งที่มา (attribution graphs) ที่ช่วยให้เข้าใจการตัดสินใจของโมเดลได้ลึกขึ้น
Opera Neon คือเบราว์เซอร์ AI รุ่นใหม่ที่สามารถใช้ตัวแทน AI ทำงานแทนผู้ใช้ ทั้งค้นคว้า สร้างเว็บไซต์ เขียนโค้ด และทำงานอัตโนมัติหลายอย่างแม้ในขณะที่คุณออฟไลน์ โดย Opera เตรียมเปิดให้ใช้งานในรูปแบบสมัครสมาชิกพรีเมียมเร็ว ๆ นี้
Anthropic เปิดตัวโหมดเสียง (Voice Mode) สำหรับแอป Claude ให้ผู้ใช้สนทนาด้วยเสียงแบบเรียลไทม์ พร้อมเลือกเสียงได้ 5 แบบ และรองรับการใช้งานร่วมกับเอกสารและรูปภาพ
Mistral AI คือสตาร์ทอัพฝรั่งเศสที่พัฒนาโมเดล AI และแชทบอท Le Chat โดยมุ่งเน้นความเปิดกว้างและความเป็นอิสระ ได้รับการสนับสนุนจากรัฐบาลฝรั่งเศสและพันธมิตรรายใหญ่
Veo 3 โมเดลใหม่จาก Google สามารถสร้างวิดีโอพร้อมเสียงได้อย่างสมจริงจนน่าขนลุก แม้ผู้ใช้ไม่ได้ใส่คำสั่งเสียงไว้ก็ตาม แสดงให้เห็นถึงพลังของ AI ในการแต่งเติมและสร้างสรรค์เนื้อหาเกินกว่าที่ป้อนเข้าไป
Google เปิดตัว Gemini ใน Chrome ที่ให้ผู้ใช้สนทนากับ AI ได้โดยตรงจากเบราว์เซอร์ พร้อมความสามารถในการมองเห็นหน้าจอและแนะนำเนื้อหาตามบริบท