Amazon Bedrock Guardrails

ใช้มาตรการป้องกันที่ปรับแต่งตามความต้องการของแอปพลิเคชันและนโยบาย AI อย่างมีความรับผิดชอบ

สร้างแอปพลิเคชัน AI ที่มีความรับผิดชอบด้วย Guardrails

Amazon Bedrock Guardrails มีการป้องกันที่กำหนดค่าได้เพื่อช่วยสร้างแอปพลิเคชัน AI ช่วยสร้างได้อย่างปลอดภัยในทุกขนาด เนื่องจากมีแนวทางที่สอดคล้องกันและเป็นมาตรฐานซึ่งถูกนำไปใช้ในโมเดลพื้นฐาน (FM) หลากหลายรูปแบบ ซึ่งรวมถึง FM ที่รองรับใน Amazon Bedrock, โมเดลที่ผ่านการปรับแต่งเพิ่มเติม และโมเดลที่โฮสต์จากภายนอก Amazon Bedrock จึงทำให้กฎควบคุมระบบสามารถมอบการป้องกันด้านความปลอดภัยชั้นนำของอุตสาหกรรมได้ในรูปแบบต่อไปนี้

  • ใช้การให้เหตุผลอัตโนมัติเพื่อช่วยป้องกันข้อผิดพลาดตามข้อเท็จจริงจากผลลัพธ์เพี้ยน ซึ่งเป็นการป้องกัน AI ช่วยสร้างอย่างแรกและอย่างเดียวที่สามารถทำได้
  • การป้องกันเนื้อหาที่เป็นข้อความและรูปภาพชั้นนำของอุตสาหกรรม ซึ่งช่วยให้ลูกค้าบล็อกเนื้อหาหลายรูปแบบที่เป็นอันตรายได้ถึง 88%
  • กรองการตอบสนองที่เป็นผลลัพธ์เพี้ยนกว่า 75% จากโมเดลสำหรับกรณีการใช้งานการดึงข้อมูลเพื่อการสร้างแบบเสริม (RAG) และการสรุป

Remitly พลิกโฉมการสนับสนุนลูกค้าด้วยความเร็วและความไว้วางใจโดยใช้ Amazon Bedrock

KONE ช่วยส่งเสริมบริการภาคสนามของ AI ที่มีความรับผิดชอบด้วย Amazon Bedrock

สร้างระดับความปลอดภัยที่สม่ำเสมอในแอปพลิเคชัน Gen AI

Guardrails เป็นความสามารถของ AI ที่มีความรับผิดชอบเพียงอย่างเดียวที่ให้บริการโดยผู้ให้บริการระบบคลาวด์รายใหญ่ ซึ่งช่วยให้คุณสามารถสร้างและปรับแต่งการป้องกันความปลอดภัย ความเป็นส่วนตัว และความจริงให้กับแอปพลิเคชัน AI ช่วยสร้างในโซลูชันเดียว Guardrails จะช่วยประเมินอินพุตของผู้ใช้และการตอบสนองของโมเดลตามนโยบายเฉพาะกรณีใช้งาน และเพิ่มการป้องกันเพิ่มเติมกับอินพุตและการตอบสนองที่ FM ระบุตั้งแต่ต้น Guardrails ทำงานร่วมกับโมเดลที่หลากหลาย รวมถึง FM ที่รองรับใน Amazon Bedrock โมเดลที่ปรับแต่งอย่างละเอียด และโมเดลที่โฮสต์ด้วยตนเองภายนอก Amazon Bedrock อินพุตของผู้ใช้และเอาต์พุตของโมเดลจะได้รับการประเมินอย่างอิสระสำหรับโมเดลจากภายนอกและโมเดลที่โฮสต์ด้วยตนเองโดยใช้ ApplyGuardrail API  นอกจากนี้ยังสามารถผสานรวม Guardrails เข้ากับ Amazon Bedrock Agents และ Amazon Bedrock Knowledge Bases เพื่อสร้างแอปพลิเคชัน AI ช่วยสร้างที่ปลอดภัยและมั่นคงซึ่งสอดคล้องกับนโยบาย AI ที่มีความรับผิดชอบมากยิ่งขึ้น

ภาพหน้าจอ UI

ตรวจจับผลลัพธ์เพี้ยนในการตอบสนองแบบจำลองโดยใช้การตรวจสอบกราวด์ตามบริบท

ลูกค้าจำเป็นต้องปรับใช้แอปพลิเคชัน AI ช่วยสร้างจริงและเชื่อถือได้เพื่อรักษาและเพิ่มความไว้วางใจของผู้ใช้ อย่างไรก็ตาม FM อาจสร้างข้อมูลที่ไม่ถูกต้องขึ้นมาเนื่องจากผลลัพธ์เพี้ยน เช่น การเบี่ยงเบนจากข้อมูลแหล่งที่มา การรวมข้อมูลหลายชิ้นเข้าด้วยกัน หรือการสร้างข้อมูลใหม่ขึ้นมา Guardrails รองรับการตรวจสอบกราวด์ตามบริบทเพื่อช่วยตรวจจับและกรองผลลัพธ์เพี้ยนออกหากการตอบสนองไม่เป็นไม่ได้ตั้งอยู่บนข้อมูลแหล่งที่มาและไม่เกี่ยวข้องกับคำถามหรือคำแนะนำของผู้ใช้ (เช่น ข้อมูลที่ไม่ถูกต้องตามข้อเท็จจริงหรือข้อมูลใหม่) การตรวจสอบกราวด์ตามบริบทสามารถช่วยตรวจจับผลลัพธ์เพี้ยนสำหรับ RAG การประยุกต์สรุป และการสนทนา ซึ่งข้อมูลแหล่งข้อมูลสามารถใช้เป็นข้อมูลอ้างอิงเพื่อตรวจสอบการตอบสนองของโมเดล

ภาพหน้าจอ UI

ช่วยป้องกันข้อผิดพลาดตามข้อเท็จจริงจากผลลัพธ์เพี้ยนและให้ความถูกต้องแม่นยำที่ตรวจสอบได้ด้วยการตรวจสอบการให้เหตุผลอัตโนมัติ

การตรวจสอบการให้เหตุผลอัตโนมัติ (เวอร์ชันทดลองใช้) ใน Amazon Bedrock Guardrails เป็นการป้องกัน AI ช่วยสร้างสรรค์แรกและการป้องกันเดียวที่ช่วยป้องกันข้อผิดพลาดตามข้อเท็จจริงจากผลลัพธ์เพี้ยนโดยใช้เหตุผลที่ถูกต้องแม่นยำและตรวจสอบได้อย่างมีเหตุผลซึ่งอธิบายว่าทำไมการตอบสนองจึงถูกต้อง การให้เหตุผลอัตโนมัติช่วยลดผลลัพธ์เพี้ยนโดยใช้เทคนิคทางคณิตศาสตร์ที่แม่นยำเพื่อตรวจสอบยืนยัน แก้ไข และอธิบายข้อมูลที่สร้างขึ้นอย่างมีเหตุผล ซึ่งทำให้แน่ใจว่าผลลัพธ์สอดคล้องกับข้อเท็จจริงที่ทราบกันดีและไม่ได้อิงตามข้อมูลที่แต่งขึ้นมาใหม่หรือข้อมูลไม่สอดคล้องกัน นักพัฒนาสามารถสร้างนโยบายการให้เหตุผลอัตโนมัติโดยการอัปโหลดเอกสารที่มีอยู่ซึ่งกำหนดขั้นตอนในการแก้ปัญหาที่เหมาะสม เช่น แนวทางด้านทรัพยากรบุคคลหรือคู่มือการดำเนินงาน จากนั้น Amazon Bedrock จะสร้างนโยบายการให้เหตุผลอัตโนมัติที่ไม่ซ้ำกัน พร้อมทั้งแนะนำผู้ใช้ผ่านการทดสอบและปรับแต่ง หากต้องการตรวจสอบเนื้อหาที่สร้างขึ้นตามนโยบายการให้เหตุผลอัตโนมัติ ผู้ใช้จะต้องเปิดใช้งานนโยบายใน Guardrails แล้วกำหนดค่านโยบายด้วยรายการ Amazon Resource Name (ARN) ที่ไม่ซ้ำกัน กระบวนการตรวจสอบยืนยันอัลกอริทึมตามตรรกะนี้ช่วยให้มั่นใจได้ว่าข้อมูลที่โมเดลสร้างขึ้นนั้นสอดคล้องกับข้อเท็จจริงที่ทราบกันดีและไม่ได้อิงตามข้อมูลที่แต่งขึ้นมาใหม่หรือข้อมูลไม่สอดคล้องกัน การตรวจสอบเหล่านี้จะมอบการตอบสนองที่แท้จริงซึ่งพิสูจน์ได้จากโมเดล AI ช่วยสร้าง โดยทำให้ผู้จัดจำหน่ายซอฟต์แวร์สามารถเพิ่มความเสถียรของแอปพลิเคชันสำหรับกรณีการใช้งานในด้านทรัพยากรบุคคล การเงิน กฎหมาย การปฏิบัติตามข้อกำหนด และอีกมากมายได้

วิดีโอ

บล็อกหัวข้อที่ไม่พึงประสงค์ในแอปพลิเคชัน Gen AI

ผู้นำองค์กรตระหนักถึงความจำเป็นในการจัดการปฏิสัมพันธ์ภายในแอปพลิเคชัน AI ช่วยสร้างเพื่อประสบการณ์ผู้ใช้ที่ตรงประเด็นและปลอดภัย ซึ่งต้องการปรับแต่งการโต้ตอบเพิ่มเติมเพื่อให้ยังคงโฟกัสที่หัวข้อที่ตรงประเด็นกับธุรกิจของตน และสอดคล้องกับนโยบายของบริษัท Guardrails จะช่วยให้คุณสามารถกำหนดชุดหัวข้อที่ต้องการหลีกเลี่ยงภายในบริบทของแอปพลิเคชันด้วยการใช้คำอธิบายสั้น ๆ ด้วยภาษาที่เป็นธรรมชาติ โดย Guardrails จะช่วยตรวจจับและบล็อกอินพุตของผู้ใช้และการตอบสนอง FM ที่อยู่ในหัวข้อที่ถูกจำกัด ตัวอย่างเช่น สามารถออกแบบผู้ช่วยด้านการธนาคารเพื่อหลีกเลี่ยงหัวข้อที่เกี่ยวข้องกับคำแนะนำการลงทุน

ภาพหน้าจอ UI

กรองเนื้อหาหลายรูปแบบที่เป็นอันตรายตามนโยบาย AI ที่มีความรับผิดชอบของคุณ

กฎควบคุมระบบมีตัวกรองเนื้อหาพร้อมเกณฑ์ที่สามารถกำหนดค่าได้สำหรับเนื้อหาข้อความและภาพที่เป็นอันตราย มาตรการป้องกันจะช่วยกรองเนื้อหาหลายรูปแบบที่เป็นอันตรายซึ่งมีหัวข้อต่าง ๆ เช่น คำพูดที่แสดงความเกลียดชัง การดูหมิ่น เพศ ความรุนแรง และการประพฤติมิชอบ (รวมถึงกิจกรรมทางอาญา) และช่วยป้องกันการโจมตีพร้อมท์ (Prompt Injection และการเจลเบรก) ตัวกรองเนื้อหาจะประเมินอินพุตของผู้ใช้และการตอบสนองของโมเดลโดยอัตโนมัติเพื่อตรวจจับและช่วยป้องกันข้อความและ/หรือรูปภาพที่ไม่ต้องการและอาจเป็นอันตราย ตัวอย่างเช่น เว็บไซต์อีคอมเมิร์ซสามารถออกแบบผู้ช่วยออนไลน์เพื่อหลีกเลี่ยงการใช้ภาษาที่ไม่เหมาะสม เช่น คำพูดที่แสดงความเกลียดชังหรือหมิ่นประมาท

ภาพหน้าจอ UI

แก้ไขข้อมูลที่มีความละเอียดอ่อน เช่น PII เพื่อปกป้องความเป็นส่วนตัว

Guardrails ช่วยให้คุณสามารถตรวจจับเนื้อหาที่มีความละเอียดอ่อนได้ เช่น ข้อมูลที่ระบุตัวตนของบุคคลได้ (PII) ในอินพุตของผู้ใช้และการตอบสนอง FM คุณสามารถเลือกจากรายการ PII ที่กำหนดไว้ล่วงหน้าหรือกำหนดประเภทข้อมูลที่มีความละเอียดอ่อนแบบกำหนดเองโดยใช้นิพจน์ปกติ (RegEx) ขึ้นอยู่กับกรณีการใช้งาน คุณสามารถเลือกปฏิเสธอินพุตที่มีข้อมูลที่ละเอียดอ่อนหรือแก้ไขในการตอบสนอง FM ตัวอย่างเช่น คุณสามารถแก้ไขข้อมูลส่วนบุคคลของผู้ใช้ในขณะที่สร้างสรุปจากการถอดเสียงการสนทนาของลูกค้าและเจ้าหน้าที่ในคอลเซ็นเตอร์

ภาพหน้าจอ UI

ขั้นตอนถัดไป