Red Hat AI 3 มอบศักยภาพ ‘Distributed AI Inference’ พลิกโฉมองค์กรสู่การใช้งาน AI จริง ขับเคลื่อนยุค Agentic AI

Red Hat AI 3 มอบศักยภาพ 'Distributed AI Inference' พลิกโฉมองค์กรสู่การใช้งาน AI จริง ขับเคลื่อนยุค Agentic AI

เปิดตัว Red Hat AI 3 แพลตฟอร์ม AI ระดับองค์กรที่ผสานรวมนวัตกรรมล่าสุดของ Red Hat AI Inference Server, Red Hat Enterprise Linux AI (RHEL AI), และ Red Hat OpenShift AI เข้าไว้ด้วยกัน เพื่อลดความซับซ้อนของการอนุมาน AI (AI inference) ประสิทธิภาพสูงในการปรับใช้ขนาดใหญ่ (high-performance AI inference) ซึ่งเป็นหัวใจสำคัญของการนำ AI Workloads จากขั้นตอนการทดลอง (proofs-of-concept) ไปสู่การใช้งานจริง (production) ได้ง่ายขึ้น


แก้โจทย์ความท้าทาย: เมื่อ AI ก้าวสู่การใช้งานจริง

ในขณะที่องค์กรธุรกิจจำนวนมากเริ่มก้าวข้ามขั้นตอนการทดลองใช้ AI พวกเขาต้องเผชิญกับอุปสรรคสำคัญด้าน ความเป็นส่วนตัวของข้อมูล, การควบคุมต้นทุน, และการจัดการโมเดลที่หลากหลาย สอดคล้องกับรายงานจาก MIT ที่ชี้ว่าประมาณ 95% ขององค์กรยังไม่เห็นผลตอบแทนทางการเงินที่วัดผลได้จากการใช้จ่ายด้าน AI มหาศาล

Red Hat AI 3 ถูกออกแบบมาเพื่อแก้ไขความท้าทายเหล่านี้ โดยนำเสนอประสบการณ์ที่ สอดคล้องและเป็นเอกภาพ สำหรับผู้บริหารและผู้นำด้านไอที แพลตฟอร์มนี้สร้างบน Open Standards รองรับการปรับขนาดและกระจาย AI workloads ไปยังสภาพแวดล้อม ไฮบริดคลาวด์ ที่มีผู้ให้บริการหลายรายได้อย่างรวดเร็ว ตั้งแต่ดาต้าเซ็นเตอร์ ไปจนถึง Edge ที่ห่างไกล ตอบโจทย์ทุกประเภทของโมเดลและ Hardware Accelerators (รวมถึง NVIDIA และ AMD)


เน้น ‘Inference’ คือหัวใจหลักของการนำไปใช้จริง

เมื่อโครงการ AI ถูกนำไปใช้งานจริง จุดเน้นจะเปลี่ยนจากการเทรนโมเดลไปสู่ การอนุมาน (Inference) ซึ่งเป็นขั้นตอนของการนำ AI ไปใช้งานจริง Red Hat AI 3 จึงให้ความสำคัญกับการอนุมานที่สามารถปรับขนาดได้และคุ้มค่าการลงทุน โดยพัฒนาต่อยอดจากโปรเจกต์โอเพ่นซอร์สที่ประสบความสำเร็จ เช่น vLLM และ llm-d

Red Hat OpenShift AI 3.0 เปิดให้ใช้งาน llm-d เวอร์ชันพร้อมใช้งานทั่วไป ซึ่งเป็นก้าวสำคัญในการบริหารจัดการ LLM (Large Language Model) บน Kubernetes เพื่อให้ใช้งานฮาร์ดแวร์เร่งความเร็วได้อย่างเต็มประสิทธิภาพ llm-d ช่วยให้เกิด Intelligent Distributed Inference (การอนุมานแบบกระจายอัจฉริยะ) ด้วยการผสานการทำงานของ Kubernetes และประสิทธิภาพของ vLLM พร้อมด้วยเทคโนโลยีโอเพ่นซอร์สอื่น ๆ เช่น NVIDIA Dynamo (NIXL) และ DeepEP MoE (Mixture of Experts) communication library ส่งผลให้องค์กรสามารถ:

  • ลดต้นทุนและปรับปรุงเวลาตอบสนอง ด้วยระบบจัดตารางรันโมเดลแบบ Inference-aware
  • เพิ่มความน่าเชื่อถือ ด้วย Well-lit Paths ที่ช่วยปรับปรุงขั้นตอนการนำโมเดลไปใช้งานบน Kubernetes
  • เพิ่มความยืดหยุ่นสูงสุด ด้วยการรองรับการทำงานข้ามแพลตฟอร์มกับ Hardware Accelerators ที่หลากหลาย

แพลตฟอร์มรวมศูนย์เพื่อการทำงานร่วมกันและการสร้าง Agentic AI

Red Hat AI 3 มอบประสบการณ์ครบวงจรที่ส่งเสริมการทำงานร่วมกันระหว่าง วิศวกรแพลตฟอร์ม และ วิศวกร AI ผ่านฟีเจอร์ใหม่ที่ขับเคลื่อนกลยุทธ์ AI อย่างมีประสิทธิภาพ:

  • Model as a Service (MaaS): ให้ทีม IT สามารถเป็นผู้ให้บริการโมเดลของตนเอง (Self-managed MaaS) เสนอโมเดลกลาง (Shared Models) ให้กับทีมพัฒนาแบบ On-demand ภายในองค์กร ช่วยบริหารต้นทุนและตอบโจทย์ด้านความเป็นส่วนตัว
  • AI Hub: ศูนย์รวมแคตตาล็อกโมเดลที่คัดสรร, ระบบ Registry จัดการไลฟ์ไซเคิลโมเดล, และสภาพแวดล้อมการติดตั้งและติดตาม
  • Gen AI Studio: สภาพแวดล้อมเชิงโต้ตอบ (Stateless Playground) สำหรับวิศวกร AI ในการสร้างต้นแบบแอปพลิเคชัน Gen AI, ทดสอบ Prompts, และปรับแต่งโมเดล (เช่น สำหรับ Chat และ RAG)

นอกจากนี้ Red Hat OpenShift AI 3.0 ยังวางรากฐานสำหรับระบบ Agentic AI (AI Agents) รุ่นต่อไป ซึ่งเป็นเวิร์กโฟลว์อิสระและซับซ้อนที่กำลังจะมาถึง โดยยกระดับความสามารถการอนุมานและมาพร้อม Unified API Layer ที่พัฒนาบน Llama Stack เพื่อเร่งกระบวนการสร้างและปรับใช้ Agent พร้อมการรองรับมาตรฐาน Model Context Protocal (MCP) ที่ช่วยให้การสื่อสารระหว่างโมเดล AI และเครื่องมือภายนอกเป็นไปอย่างมีประสิทธิภาพ

Joe Fernandes, vice president and general manager, AI Business Unit, Red Hat กล่าวว่า “Red Hat AI 3 ออกแบบมาเพื่อช่วยองค์กรลดความซับซ้อนและต้นทุนในการนำ AI สู่การใช้งานจริง ด้วยความสามารถใหม่ เช่น ระบบการอนุมานแบบกระจาย (distributed inference) ผ่าน llm-d และรากฐานสำหรับ Agentic AI ซึ่งจะช่วยให้ทีมไอทีใช้งาน AI รุ่นถัดไปได้อย่างมั่นใจ บนโครงสร้างพื้นฐานรูปแบบใดก็ได้ ตามแนวทางขององค์กร”

“Dante” สปายแวร์ใหม่จาก HackingTeam พลิกโฉมการจารกรรมไซเบอร์

Scroll to Top