Quy tắc bảo vệ của Amazon Bedrock
Thực hiện các biện pháp bảo vệ tùy chỉnh theo yêu cầu ứng dụng của bạn và chính sách AI có trách nhiệm
Xây dựng các ứng dụng AI có trách nhiệm với Quy tắc bảo vệ
Quy tắc bảo vệ Amazon Bedrock cung cấp các biện pháp bảo vệ có thể cấu hình để giúp phát triển ứng dụng AI tạo sinh một cách an toàn ở quy mô lớn. Nhờ vận dụng cách tiếp cận nhất quán và chuẩn chỉ trên nhiều mô hình nền tảng (FM) bao gồm FM được hỗ trợ trên Amazon Bedrock, mô hình đã qua tinh chỉnh và mô hình được lưu trữ bên ngoài Amazon Bedrock, Quy tắc bảo vệ mang đến các biện pháp bảo vệ an toàn hàng đầu trong ngành:
- Sử dụng Suy luận tự động giúp ngăn chặn lỗi thông tin sai lệch phát sinh từ ảo giác – đây là biện pháp bảo vệ AI tạo sinh đầu tiên và duy nhất có thể thực hiện được điều này
- Bảo vệ nội dung văn bản và hình ảnh hàng đầu trong ngành, giúp khách hàng chặn tới 88% nội dung đa phương thức gây hại
- Lọc hơn 75% phản hồi ảo giác từ các mô hình cho các trường hợp sử dụng Tạo có kết hợp truy xuất thông tin ngoài (RAG) và tóm tắt
Remitly chuyển đổi dịch vụ hỗ trợ khách hàng nhanh chóng và đáng tin cậy với Amazon Bedrock
KONE cung cấp dịch vụ hiện trường AI có trách nhiệm bằng Amazon Bedrock
Mang lại mức độ an toàn AI nhất quán trên tất cả ứng dụng AI tạo sinh
Quy tắc bảo vệ là chức năng AI có trách nhiệm duy nhất do một nhà cung cấp dịch vụ đám mây lớn cung cấp, giúp bạn xây dựng và tùy chỉnh biện pháp bảo vệ an toàn, quyền riêng tư và tính trung thực cho các ứng dụng AI tạo sinh trong một giải pháp duy nhất. Quy tắc bảo vệ giúp đánh giá đầu vào của người dùng và mô hình phản hồi của FM dựa trên các chính sách theo trường hợp sử dụng cụ thể và tăng cường bảo vệ thêm ngoài khả năng bảo vệ từ FM. Quy tắc bảo vệ hoạt động với một loạt các mô hình bao gồm FM được hỗ trợ trong Amazon Bedrock, các mô hình tinh chỉnh, cũng như các mô hình tự lưu trữ bên ngoài Amazon Bedrock. Dữ liệu đầu vào của người dùng và đầu ra của mô hình có thể được đánh giá độc lập cho các mô hình của bên thứ ba và mô hình tự lưu trữ bằng API ApplyGuardrail. Quy tắc bảo vệ cũng có thể được tích hợp với Tác tử của Amazon Bedrock và Cơ sở kiến thức của Amazon Bedrock để xây dựng các ứng dụng AI tạo sinh an toàn và bảo mật hơn, phù hợp với các chính sách AI có trách nhiệm.

Phát hiện ảo giác trong phản hồi của mô hình bằng cách sử dụng kiểm tra nền tảng theo ngữ cảnh
Khách hàng cần triển khai các ứng dụng AI tạo sinh trung thực và đáng tin cậy để duy trì và phát triển niềm tin của người dùng. Tuy nhiên, FM có thể tạo ra thông tin không chính xác do ảo giác: sai lệch so với thông tin nguồn, trộn lẫn nhiều thông tin hoặc bịa đặt thông tin mới. Quy tắc bảo vệ hỗ trợ kiểm tra nền tảng theo ngữ cảnh để giúp phát hiện và lọc ảo giác nếu các phản hồi không có cơ sở (ví dụ: thông tin mới hoặc không chính xác về mặt thực tế) trong thông tin nguồn và không liên quan đến truy vấn hoặc hướng dẫn của người dùng. Kiểm tra nền tảng theo ngữ cảnh có thể giúp phát hiện ảo giác cho RAG, tóm tắt và các ứng dụng hội thoại, trong đó thông tin nguồn có thể được sử dụng làm tham chiếu để xác thực phản hồi của mô hình.

Giúp ngăn chặn lỗi thông tin sai lệch phát sinh từ ảo giác và đảm bảo độ chính xác có thể kiểm chứng với kiểm tra Suy luận tự động
Kiểm tra Suy luận tự động (xem trước) trong Quy tắc bảo vệ Amazon Bedrock là biện pháp bảo vệ AI tạo sinh đầu tiên và duy nhất giúp tránh để xảy ra lỗi thực tế từ ảo giác bằng cách sử dụng suy luận chính xác về mặt logic và có thể kiểm chứng để giải thích lý do tại sao phản hồi là đúng. Suy luận tự động giúp hạn chế ảo giác thông qua các kỹ thuật toán học hợp lý để xác minh, chỉnh và giải thích hợp lý thông tin được tạo ra, đảm bảo thông tin đầu phù hợp với dữ kiện đã xác định và không dựa trên dữ liệu giả hoặc không nhất quán. Các nhà phát triển có thể lập chính sách bằng Suy luận tự động khi tải lên tài liệu hiện có để xác định đúng không gian giải pháp như hướng dẫn của phòng nhân sự hoặc hướng dẫn vận hành. Sau đó, Amazon Bedrock sẽ lập chính sách Suy luận tự động độc đáo và hướng dẫn người dùng thử nghiệm cũng như tinh chỉnh chính sách đó. Để xác thực nội dung được tạo theo chính sách Suy luận tự động, người dùng cần bật chính sách trong Quy tắc bảo vệ và định cấu hình chính sách này bằng danh sách Tên tài nguyên Amazon (ARN) duy nhất. Quá trình xác minh thuật toán dựa trên logic này đảm bảo rằng thông tin do mô hình tạo ra phù hợp với dữ kiện đã xác định và không dựa trên dữ liệu giả hoặc không nhất quán. Các kiểm tra này đưa ra phản hồi có thể chứng minh là đúng sự thật từ các mô hình AI tạo sinh, cho phép nhà cung cấp phần mềm nâng cao độ tin cậy của ứng dụng cho các trường hợp sử dụng trong nhân sự, tài chính, pháp lý, tuân thủ, v.v.

Chặn chủ đề không mong muốn trong ứng dụng AI tạo sinh
Các nhà lãnh đạo tổ chức nhận ra sự cần thiết của việc quản lý các tương tác trong các ứng dụng AI tạo sinh để đạt được trải nghiệm người dùng phù hợp và an toàn. Họ muốn tùy chỉnh nhiều hơn nữa các tương tác để tiếp tục tập trung vào các chủ đề liên quan đến doanh nghiệp của họ và phù hợp với chính sách của công ty. Sử dụng mô tả ngắn gọn bằng ngôn ngữ tự nhiên, Quy tắc bảo vệ giúp bạn xác định tập hợp các chủ đề cần tránh trong bối cảnh ứng dụng của bạn. Quy tắc bảo vệ giúp phát hiện và chặn đầu vào của người dùng và phản hồi của FM thuộc các chủ đề bị hạn chế. Ví dụ: một trợ lý ngân hàng có thể được thiết kế để tránh các chủ đề liên quan đến tư vấn đầu tư.

Lọc nội dung đa phương thức gây hại dựa trên các chính sách AI có trách nhiệm của bạn
Quy tắc bảo vệ cung cấp các bộ lọc nội dung với các ngưỡng có thể cấu hình cho nội dung văn bản và hình ảnh độc hại. Các biện pháp bảo vệ giúp lọc nội dung đa phương thức gây hại có chứa các chủ đề như phát ngôn thù hận, lăng mạ, khiêu dâm, bạo lực và hành vi sai trái (bao gồm cả hoạt động tội phạm) và giúp bảo vệ chống lại các cuộc tấn công bằng câu lệnh (bơm câu lệnh và bẻ khóa). Bộ lọc nội dung tự động đánh giá cả đầu vào của người dùng và phản hồi của mô hình để phát hiện và giúp ngăn chặn văn bản và/hoặc hình ảnh không mong muốn và có nguy cơ gây hại. Ví dụ, một trang web thương mại điện tử có thể thiết kế trợ lý trực tuyến của mình để tránh sử dụng ngôn ngữ không phù hợp như lời nói thù ghét hoặc lăng mạ.

Biên tập thông tin nhạy cảm như PII để bảo vệ quyền riêng tư
Quy tắc bảo vệ giúp bạn phát hiện được nội dung nhạy cảm, chẳng hạn như thông tin nhận dạng cá nhân (PII), trong đầu vào của người dùng và phản hồi của FM. Bạn có thể chọn từ danh sách các PII được xác định trước hoặc xác định loại thông tin nhạy cảm tùy chỉnh bằng cách sử dụng biểu thức chính quy (RegEx). Dựa trên trường hợp sử dụng, bạn có thể từ chối có chọn lọc các đầu vào có chứa thông tin nhạy cảm hoặc biên tập các đầu vào đó trong các phản hồi của FM. Ví dụ: bạn có thể biên tập thông tin cá nhân của người dùng trong khi tạo tóm tắt từ bản chuyển lời thoại của cuộc trò chuyện giữa khách hàng và nhân viên tổng đài.

Các bước tiếp theo
Hôm nay, bạn đã tìm thấy nội dung mình cần chưa?
Chia sẻ với chúng tôi để chúng tôi có thể cải thiện chất lượng nội dung trên trang.