Red Hat AI 3 มอบศักยภาพ ‘Distributed AI Inference’ พลิกโฉมองค์กรสู่การใช้งาน AI จริง ขับเคลื่อนยุค Agentic AI

October 28, 2025
10:19 pm

เปิดตัว Red Hat AI 3 แพลตฟอร์ม AI ระดับองค์กรที่ผสานรวมนวัตกรรมล่าสุดของ Red Hat AI Inference Server, Red Hat Enterprise Linux AI (RHEL AI), และ Red Hat OpenShift AI เข้าไว้ด้วยกัน เพื่อลดความซับซ้อนของการอนุมาน AI (AI inference) ประสิทธิภาพสูงในการปรับใช้ขนาดใหญ่ (high-performance AI inference) ซึ่งเป็นหัวใจสำคัญของการนำ AI Workloads จากขั้นตอนการทดลอง (proofs-of-concept) ไปสู่การใช้งานจริง (production) ได้ง่ายขึ้น

แก้โจทย์ความท้าทาย: เมื่อ AI ก้าวสู่การใช้งานจริง

ในขณะที่องค์กรธุรกิจจำนวนมากเริ่มก้าวข้ามขั้นตอนการทดลองใช้ AI พวกเขาต้องเผชิญกับอุปสรรคสำคัญด้าน ความเป็นส่วนตัวของข้อมูล, การควบคุมต้นทุน, และการจัดการโมเดลที่หลากหลาย สอดคล้องกับรายงานจาก MIT ที่ชี้ว่าประมาณ 95% ขององค์กรยังไม่เห็นผลตอบแทนทางการเงินที่วัดผลได้จากการใช้จ่ายด้าน AI มหาศาล

Red Hat AI 3 ถูกออกแบบมาเพื่อแก้ไขความท้าทายเหล่านี้ โดยนำเสนอประสบการณ์ที่ สอดคล้องและเป็นเอกภาพ สำหรับผู้บริหารและผู้นำด้านไอที แพลตฟอร์มนี้สร้างบน Open Standards รองรับการปรับขนาดและกระจาย AI workloads ไปยังสภาพแวดล้อม ไฮบริดคลาวด์ ที่มีผู้ให้บริการหลายรายได้อย่างรวดเร็ว ตั้งแต่ดาต้าเซ็นเตอร์ ไปจนถึง Edge ที่ห่างไกล ตอบโจทย์ทุกประเภทของโมเดลและ Hardware Accelerators (รวมถึง NVIDIA และ AMD)

เน้น ‘Inference’ คือหัวใจหลักของการนำไปใช้จริง

เมื่อโครงการ AI ถูกนำไปใช้งานจริง จุดเน้นจะเปลี่ยนจากการเทรนโมเดลไปสู่ การอนุมาน (Inference) ซึ่งเป็นขั้นตอนของการนำ AI ไปใช้งานจริง Red Hat AI 3 จึงให้ความสำคัญกับการอนุมานที่สามารถปรับขนาดได้และคุ้มค่าการลงทุน โดยพัฒนาต่อยอดจากโปรเจกต์โอเพ่นซอร์สที่ประสบความสำเร็จ เช่น vLLM และ llm-d

Red Hat OpenShift AI 3.0 เปิดให้ใช้งาน llm-d เวอร์ชันพร้อมใช้งานทั่วไป ซึ่งเป็นก้าวสำคัญในการบริหารจัดการ LLM (Large Language Model) บน Kubernetes เพื่อให้ใช้งานฮาร์ดแวร์เร่งความเร็วได้อย่างเต็มประสิทธิภาพ llm-d ช่วยให้เกิด Intelligent Distributed Inference (การอนุมานแบบกระจายอัจฉริยะ) ด้วยการผสานการทำงานของ Kubernetes และประสิทธิภาพของ vLLM พร้อมด้วยเทคโนโลยีโอเพ่นซอร์สอื่น ๆ เช่น NVIDIA Dynamo (NIXL) และ DeepEP MoE (Mixture of Experts) communication library ส่งผลให้องค์กรสามารถ:

ลดต้นทุนและปรับปรุงเวลาตอบสนอง ด้วยระบบจัดตารางรันโมเดลแบบ Inference-aware
เพิ่มความน่าเชื่อถือ ด้วย Well-lit Paths ที่ช่วยปรับปรุงขั้นตอนการนำโมเดลไปใช้งานบน Kubernetes
เพิ่มความยืดหยุ่นสูงสุด ด้วยการรองรับการทำงานข้ามแพลตฟอร์มกับ Hardware Accelerators ที่หลากหลาย

แพลตฟอร์มรวมศูนย์เพื่อการทำงานร่วมกันและการสร้าง Agentic AI

Red Hat AI 3 มอบประสบการณ์ครบวงจรที่ส่งเสริมการทำงานร่วมกันระหว่าง วิศวกรแพลตฟอร์ม และ วิศวกร AI ผ่านฟีเจอร์ใหม่ที่ขับเคลื่อนกลยุทธ์ AI อย่างมีประสิทธิภาพ:

Model as a Service (MaaS): ให้ทีม IT สามารถเป็นผู้ให้บริการโมเดลของตนเอง (Self-managed MaaS) เสนอโมเดลกลาง (Shared Models) ให้กับทีมพัฒนาแบบ On-demand ภายในองค์กร ช่วยบริหารต้นทุนและตอบโจทย์ด้านความเป็นส่วนตัว
AI Hub: ศูนย์รวมแคตตาล็อกโมเดลที่คัดสรร, ระบบ Registry จัดการไลฟ์ไซเคิลโมเดล, และสภาพแวดล้อมการติดตั้งและติดตาม
Gen AI Studio: สภาพแวดล้อมเชิงโต้ตอบ (Stateless Playground) สำหรับวิศวกร AI ในการสร้างต้นแบบแอปพลิเคชัน Gen AI, ทดสอบ Prompts, และปรับแต่งโมเดล (เช่น สำหรับ Chat และ RAG)

นอกจากนี้ Red Hat OpenShift AI 3.0 ยังวางรากฐานสำหรับระบบ Agentic AI (AI Agents) รุ่นต่อไป ซึ่งเป็นเวิร์กโฟลว์อิสระและซับซ้อนที่กำลังจะมาถึง โดยยกระดับความสามารถการอนุมานและมาพร้อม Unified API Layer ที่พัฒนาบน Llama Stack เพื่อเร่งกระบวนการสร้างและปรับใช้ Agent พร้อมการรองรับมาตรฐาน Model Context Protocal (MCP) ที่ช่วยให้การสื่อสารระหว่างโมเดล AI และเครื่องมือภายนอกเป็นไปอย่างมีประสิทธิภาพ

Joe Fernandes, vice president and general manager, AI Business Unit, Red Hat กล่าวว่า “Red Hat AI 3 ออกแบบมาเพื่อช่วยองค์กรลดความซับซ้อนและต้นทุนในการนำ AI สู่การใช้งานจริง ด้วยความสามารถใหม่ เช่น ระบบการอนุมานแบบกระจาย (distributed inference) ผ่าน llm-d และรากฐานสำหรับ Agentic AI ซึ่งจะช่วยให้ทีมไอทีใช้งาน AI รุ่นถัดไปได้อย่างมั่นใจ บนโครงสร้างพื้นฐานรูปแบบใดก็ได้ ตามแนวทางขององค์กร”

–“Dante” สปายแวร์ใหม่จาก HackingTeam พลิกโฉมการจารกรรมไซเบอร์

Songklod SaeNgow

Editor (Tech and Marketing)

Red Hat AI 3 มอบศักยภาพ ‘Distributed AI Inference’ พลิกโฉมองค์กรสู่การใช้งาน AI จริง ขับเคลื่อนยุค Agentic AI

แก้โจทย์ความท้าทาย: เมื่อ AI ก้าวสู่การใช้งานจริง

เน้น ‘Inference’ คือหัวใจหลักของการนำไปใช้จริง

แพลตฟอร์มรวมศูนย์เพื่อการทำงานร่วมกันและการสร้าง Agentic AI

Songklod SaeNgow

Social Media

Most Popular

HONOR Magic V6 เรือธงจอพับ พรีออเดอร์มาเลเซีย-สิงคโปร์

หลุดเฟรมตัวเครื่อง iPhone 18 Pro Max เผย 3 เฉดสีใหม่ พร้อมสะพัด Apple จับมือ Nvidia-Google ยกเครื่อง Siri บุกตลาด ก.ย. นี้

ลือ Xiaomi 18 Pro เตรียมอัปเกรดจอหลังใหญ่ 4 นิ้ว กล้องคู่ 200MP

Samsung: ลือสเปกชาร์จไว Galaxy Z Flip8 – เผยขนาดแบตเตอรี่ Galaxy S27 Pro – การทดสอบ One UI 9

Related Posts

ทรูบิสิเนส ปลุกกระแส Smart Energy ยุค AI ส่งยุทธศาสตร์กู้วิกฤต ‘พลังงานสูญเปล่า’ ต้นทุนเงียบซ้ำเติม SME-ครัวเรือน

STT GDC เผยบิ๊กโปรเจกต์ BKK2 คืบหน้า รับเทรนด์ AI บูม ดันดีมานด์พุ่งระดับ 100MW เล็งปักหมุดขยายไซต์นอกกรุงเทพฯ

เปิดตัว Red Hat AI 3.4 ขยายขีดความสามารถ ‘Metal-to-Agent’ ขจัดช่องว่าง มุ่งสู่ระบบอัตโนมัติระดับองค์กร

Google เปิดตัว Gemini 3.5 Flash และ Gemini Omni ยกระดับความเร็ว พร้อมฟีเจอร์สร้างวิดีโอสุดสมจริง

พูดคุยด้านเศรษฐกิจ การเงิน การลงทุน เทคโนโลยี กับ Biztalk ทุกวันเสาร์ -อาทิตย์ เวลา 17.00 น. ทางวิทยุครอบครัวข่าว FM106

News Update

Category