Tác tử thông minh.

Slides:



Advertisements
Similar presentations
GV: Nguyễn Thị Thúy Hiền PHÒNG GD&ĐT PHÚ VANG TRƯỜNG THCS PHÚ THƯỢNG.
Advertisements

5.
CHƯƠNG III: NGÂN HÀNG VÀ CÁC NGHIỆP VỤ NGÂN HÀNG.
By Nguyen Minh Quy - UTEHY
BÀI 3. ĐƯỜNG THẲNG VÀ MẶT PHẲNG SONG SONG SỞ GD&ĐT ĐIỆN BIÊN TRƯỜNG THCS-THPT TẢ SÌN THÀNG BÀI DỰ THI SOẠN GIẢNG E-LEARNING Chương II ĐƯỜNG THẲNG VÀ MẶT.
Rèn luyện nghiệp vụ sư phạm 3
Trường THPT Long Châu Sa
Giáo viên: Nguyễn Ngọc Thúy Hằng Đơn vị: Trường THPT Lê Quý Đôn
TRAO ĐỔI KINH NGHIỆM PHƯƠNG PHÁP ÔN LUYỆN & KỸ NĂNG THI TOEIC
CƠ CHẾ QUẢN LÝ KINH TẾ TRƯỚC THỜI KÌ ĐỔI MỚI (1975 – 1986)
1 BÀI 6 BẤM CÁP VÀ CHIA SẺ DỮ LIỆU MẠNG. 2 Nội Dung  Bấm cáp xoắn đôi đúng chuẩn Phương pháp bấm cáp chuẩn A Phương pháp bấm cáp chuẩn B  Kết nối máy.
TỔNG QUAN VỀ NGÔN NGỮ LẬP TRÌNH C/C++
Thị trường mới ThS. Nguyễn Văn Thoan
Chương 1: mạng máy tính và Internet
SỬ DỤNG EXCEL ĐỂ TRÍCH KHẤU HAO TSCĐ
Đầu tiên chỉ là 1 giao thức đơn giản
CHƯƠNG 9 PHẦN MỀM POWERPOINT
BÀI 4 CÔNG NGHỆ THÔNG TIN VÀ CHUỖI CUNG ỨNG
© 2007 Thomson South-Western
LẬP TRÌNH HƯỚNG ĐỐI TƯỢNG C++
Kỹ Năng Ghi Nhận - Affirmation
Công nghệ phần mềm Các quy trình phần mềm.
MỘT SỐ HƯỚNG DẪN KHI SOẠN CÂU HỎI TRẮC NGHIỆM
NHẬP MÔN VỀ KỸ THUẬT.
© 2007 Thomson South-Western
OBJECT-ORIENTED ANALYSIS AND DESIGN WITH UML 2.0
Ràng buộc toàn vẹn (Integrity Constraint)
BÀI THUYẾT TRÌNH NGÔN NGŨ LẬP TRÌNH
Dược Thảo Lợi Hại Ra Sao Kính thưa quí bạn, slide show nầy nói về những điều cần lưu ý khi tìm đọc các thông tin về các loại thuốc phụ trợ hoặc bổ sung,
CÔNG NGHỆ THƯƠNG MẠI ĐIỆN TỬ
Chương 1: Khái quát về dự án đầu tư.
VNUNi® Sales & Inventory Control
Ra quyết định kinh doanh
TIẾP CẬN CÁC CHƯƠNG TRÌNH KHOA HỌC VÀ CÔNG NGHỆ HỖ TRỢ NGÀNH DƯỢC
Theo mặc định toàn bộ dung lượng dùng lưu trữ, các thư mục hiện có trong các Partition , các dịch vụ hệ thống đã được chia sẽ cho mọi người được phép sử.
Policy Analysis Tools of the Trade NMDUC 2009.
Quản lý hệ thống file.
Chương 7 Analyzing Consumer Markets and Buyer Behavior Tìm hiểu người tiêu dùng và Phân tích hành vi của người mua.
Cấu hình đơn giản cho Router
Bài giảng môn Tin ứng dụng
Ring ? Bus ? ? Mesh ? Start ?. Ring ? Bus ? ? Mesh ? Start ?
Môn: Lập trình Hướng đối tượng (Object Oriented Programming)
Chương 6 Các chiến lược tiếp thị
TÀI LIỆU GIẢNG DẠY IC3 GS4 SPARK
GIÁO TRÌNH ĐÀO TẠO TRƯỜNG ĐẠI HỌC SÀI GÒN
Bài 8 (6 tiết): CÂY (TREE) A. CÂY VÀ CÂY NHỊ PHÂN (2 tiết)
HỆ ĐIỀU HÀNH MẠNG.
ỨNG DỤNG HIV INFO 3.0 QUẢN LÝ SỐ LIỆU NGƯỜI NHIỄM HIV/AIDS
Aleksandr Mikhailovich Lyapunov ( )
CẤU TRÚC DỮ LIỆU VÀ GIẢI THUẬT
Chương 1 Giới thiệu về máy tính
BÀI 29: LỌC DỮ LIỆU TỪ DANH SÁCH DỮ LIỆU
Chương 4 - CÁC MÔ ĐUN ĐiỀU KHIỂN TRONG HỆ THỐNG CƠ ĐiỆN TỬ
ĐÁNH GIÁ TÁC ĐỘNG SỨC KHỎE
Chương 4 Analyzing Consumer Markets and Buyer Behavior Tìm hiểu người tiêu dùng và Phân tích hành vi của người mua.
CÁC PHƯƠNG PHÁP XÁC ĐỊNH CHI PHÍ (phần B)
Tổng quan về Hệ điều hành
Lớp DH05LN GIÁO VIÊN PHỤ TRÁCH ThS. NGUYỄN QUỐC BÌNH
Environment, Health and Safety Policy
KỸ NĂNG LUYỆN TRÍ NHỚ ThS. Huỳnh Phạm Ngọc Lâm.
Please click through slides at your leisure
Chương 3. Lập trình trong SQL Server TRIGGER
AUDIO DROPBOX - TUTORIALS
Module 2 – CSR & Corporate Strategy
SỞ GIÁO DỤC VÀ ĐÀO TẠO ĐIỆN BIÊN TRƯỜNG THPT MÙN CHUNG
Company LOGO CĂN BẢN VỀ MẠNG NGUYEN TAN THANH Xem lại bài học tại
Quản trị rủi ro Những vấn đề căn bản Nguyễn Hưng Quang 07/11/2015 NHẬT HOA IC&T.
TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG CƠ SỞ II TẠI TP. HỒ CHÍ MINH HỘI NGHỊ KHOA HỌC CƠ SỞ II “BÁO CÁO HOẠT ĐỘNG ĐI THỰC TẾ CỦA GIẢNG VIÊN CSII, NĂM HỌC ”
Nghiên cứuLập kế hoạch Thực thi giao tiếp Đánh giá.
Presentation transcript:

Tác tử thông minh

Nội dung Tác tử và môi trường Một số đặc điểm của tác tử PEAS - Những yếu tố cần xem xét khi thiết kế tác tử Đặc điểm của môi trường Phân loại tác tử

Tác tử và môi trường Một tác tử - agent : bất cứ thứ gì cảm nhận môi trường quanh nó thông qua các cảm biến và tác động trở lại môi trường thông qua bộ kích hoạt. Ví dụ 1: con người - một tác tử Cảm biến: mắt, tai, … Bộ kích hoạt: tay, chân, … Ví dụ 2: Người máy Aishimo Cảm biến: camera, các bộ dò đường hồng ngoại Bộ kích hoạt: mô tơ

Tác tử và môi trường Hàm tác tử: ánh xạ từ tập cảm nhận trong quá khứ tới hành động tương ứng: f: P* Æ A Chương trình tác tử chạy trên kiến trúc vật lý để tạo ra hàm f

Chương trình tác tử dựa trên bảng điều kiện Function TABLE-DRIVEN-AGENT(percept) returns action static: percepts, một dãy cảm nhận, khởi đầu rỗng table, bảng các hành động ứng với chuỗi cảm nhận Thêm percept vào cuối dãy percepts Return action action  LOOKUP(percepts, table) Nhược điểm: sự bùng nổ kích thước của table

Ví dụ: tác tử hút bụi thông minh Dãy cảm nhận Action [A,Clean] Right [A, Dirty] Hút bụi [B, Clean] Left [B, Dirty] [A, Clean],[A, Clean] [A, Clean],[A, Dirty] … Cảm nhận: vị trí (A hoặc B), trạng thái (sạch hoặc bẩn) Hành động: qua trái, qua phải, hút bụi, NoOp

Đặc điểm của tác tử Với mỗi dãy trạng thái cảm nhận được cùng với tri thức sẵn có, tác tử phải lựa chọn hành động sao cho tối đa hóa hàm đánh giá hiệu năng Cho đích cần đạt và các tri thức sẵn có, tác tử cần: Sử dụng thông tin thu được từ các quan sát mới để cập nhật lại tri thức của nó Trên cơ sở tri thức của nó, thực thi hành động nhằm đạt được mục tiêu đề ra trong thế giới của nó. Một tác tử là tự trị nếu hành vi được xác định bởi kinh nghiệm của chính bản thân nó (với khả năng học và thích nghi)

PEAS - Yếu tố xem xét khi thiết kế Khi thiết kế, xây dựng một tác tử, phải xem xét 4 yếu tố: Performance measure: hàm đo hiệu năng Enviroment: môi trường Actuator: bộ kích hoạt Sensor: cảm biến

PEAS: một số ví dụ Tác tử lái xe tự động Tác tử mua hàng Tác tử lọc thư rác Hàm đánh giá độ an toàn, tốc độ, đúng luật, lợi ích giá, chất lượng, độ tin cậy của đơn hàng #phân loại sai Môi trường đường, giao thông, người đi bộ, lái xe người bán hàng, tác tử vận chuyển, khách hàng phần mềm email trên server/client Bộ kích hoạt bánh xe, chân ga, phanh trình bày hoá đơn, điền HĐ, gửi HĐ các thư được gán nhãn Bộ cảm biến camera, máy đo tốc độ trang HTML, form giao diện với KH nội dung thư, tiêu đề, thời gian

Đặc điểm của môi trường „ Tính quan sát được: đầy đủ - bộ phận „ Tính xác định được: trạng thái tiếp theo của môi trường có thể hoàn toàn xác định được dựa trên trạng thái hiện tại và hành động thực hiện bởi tác tử hay không? „ Tính động: môi trường là tĩnh tại hay thay đổi trong khi tác tử hoạt động? „ Tính liên tục hay rời rạc: các cảm nhận hoặc hành vi có được phân biệt một cách rõ ràng không? „ Đơn tác tử hay đa tác tử: trong môi trường, có một hay nhiều tác tử cùng hoạt động?

Phân loại tác tử Dựa vào đặc điểm của hàm tác tử, ánh xạ dãy cảm nhận tới hành động tương ứng, chia tác tử thành 4 loại: Tác tử phản xạ đơn giản Tác tử phản xạ có trạng thái Tác tử hướng mục đích Tác tử hướng lợi ích

Tác tử phản xạ đơn giản Function SIMPLE-REFLEX- AGENT(percept) returns action static: rules, tập các luật dạng điều kiện-hành động state  INTERPRET-INPUT(percept) rule  RULE-MATCH(state, rules) action  RULE-ACTION[rule] Return action

Tác tử phản xạ có trạng thái To tackle partially observable environments. Maintain internal state Over time update state using world knowledge How does the world change. How do actions affect world.  Model of World

Tác tử hướng mục đích Các dạng đích: Một trạng thái Tập các trạng thái thỏa mãn một số tính chất nào đó Một phép thử áp dụng vào trạng thái và thông báo có thỏa đích hay không Đích khiến tác tử phải suy luận về tương lai hoặc các trạng thái khác. Có thể có trường hợp không hành động nào đưa đến đích.

Tác tử hướng lợi ích Các tác tử thực hiện hành động sao cho có lợi nhất về lâu dài Các tác tử muốn thực hiện hành động đem lại lợi ích lớn hơn Có thể suy luận về các nhiệm vụ có nhiều đích, về sự xung đột giữa các đích, và về các tình huống không chắc chắn.

Tác tử với khả năng học All previous agent-programs describe methods for selecting actions. Yet it does not explain the origin of these programs. Learning mechanisms can be used to perform this task. Teach them instead of instructing them. Advantage is the robustness of the program toward initially unknown environments.