Cơ sở dữ liệu mờ và ứng dụng – Tài liệu text

Cơ sở dữ liệu mờ và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (195.94 KB, 4 trang )

Cơ sở dữ liệu mờ và ứng dụng

Phạm Vũ Hoàng

Trường Đại học Công nghệ
Luận văn ThS chuyên ngành: Công nghệ thông tin; Mã số: 1 01 10
Người hướng dẫn: PGS TS Hồ Thuần
Năm bảo vệ: 2006

Abstract: Trình bày các khái niệm cơ bản. Giới thiệu tổng quan về các mô hình cơ sở
dữ liệu mờ; Trình bày cách giải quyết các vấn đề khi mở rộng cơ sở dữ liệu quan hệ
thành cơ sở dữ liệu mờ: vấn đề phụ thuộc hàm mờ, khóa mờ, các dạng chuẩn mờ, tách
lượng đồ quan hệ mờ và dạng chuẩn mờ Boyce Codd, mở rộng cơ sở dữ liệu quan hệ
thành cơ sở dữ liệu mờ dựa trên lý thuyết khả năng; Ứng dụng giải quyết mở rộng
ngôn ngữ truy vấn dữ liệu truyền thống (SQL) thành ngôn ngữ truy vấn dữ liệu mờ
(FSQL) và ứng dụng cách tiếp cận để giải quyết bài toán quản lý cửa hàng bán lẻ
xăng dầu
Keywords: Công nghệ thông tin, Cơ sở dữ liệu mờ

Content
MỞ ĐẦU
Mô hình cơ sở dữ liệu quan hệ do Codd E.F đề xuất năm 1970 đã đạt được những kết quả
hoàn chỉnh về lý thuyết và ứng dụng. Tuy nhiên mô hình này hạn chế trong việc biểu diễn
thông tin không đầy đủ, không chắc chắn (gọi chung là dữ liệu mờ), loại dữ liệu này được
con người sử dụng thường xuyên trong thực tế. Đã có nhiều cách tiếp cận và đề xuất mô hình
cơ sở dữ liệu mờ, những kết quả lý thuyết đã được xây dựng trong mô hình quan hệ truyền
thống cũng được kiểm chứng trên các mô hình mới với những mở rộng thích hợp. Do vậy
việc tìm hiểu cơ sở dữ liệu mờ và ứng dụng vào giải quyết các bài toán thực tế là một nhu cầu
cấp thiết trong thực tiễn. Một trong những cách xây dựng một cơ sở dữ liệu mờ là mở rộng cơ
sở dữ liệu quan hệ kinh điển. Có thể mở rộng mô hình quan hệ để đáp ứng nhu cầu lưu trữ và
khai thác dữ liệu mờ theo hai hướng, đó là: mở rộng ngữ nghĩa của dữ liệu để khai thác dữ

liệu rõ với yếu tố mờ và mở rộng miền trị thuộc tính để biểu diễn được dữ liệu mờ.
Hướng mở rộng ngữ nghĩa, dữ liệu vẫn được lưu trữ như mô hình quan hệ, dữ liệu tại các
thuộc tính của các bộ vẫn là dữ liệu rõ nhưng cho phép khai thác dữ liệu với ngữ nghĩa rộng
hơn (có yếu tố mờ). Cách tiếp cận này sử dụng sử dụng lý thuyết tập mờ để mở rộng bằng
cách thêm thuộc tính độ thuộc cho mỗi bộ trong quan hệ vào quan hệ. Ví dụ ta có thể truy
xuất một cơ sở dữ liệu nguồn lực của một doanh nghiệp với một câu hỏi như sau: Liệt kê
những người trẻ tuổi trong công ty. Thế nào là trẻ tuổi?, ta sẽ phải xây dựng cơ sở logic cho
việc xử lý ngữ nghĩa mở rộng của dữ liệu như thế này và lý thuyết tập mờ và logic mờ là cơ
sở để thực hiện. Hướng mở rộng ngữ nghĩa có thể vẫn sử dụng các hệ quản trị cơ sở dữ liệu
quan hệ sẵn có trong việc lưu trữ dữ liệu, còn những mở rộng cho việc xử lý dữ liệu được xây
dựng thành các gói riêng, cài đặt thêm, nhúng vào hệ quản trị đó. Tuy nhiên cách mở rộng
này chưa cho phép lưu trữ dữ liệu mờ nên hạn chế nhiều đến khả năng quản lý dữ liệu thực tế.
Hướng mở rộng miền trị thuộc tính là cách mở rộng tổng quát hơn, phản ánh đúng bản chất
của vấn đề, nó cho phép bổ sung thêm các cú pháp trong biểu diễn dữ liệu nhằm biểu diễn
được dữ liệu mờ. Với cách mở rộng này, ngoài việc đưa vào hệ thống ký hiệu còn phải xây
dựng được cơ sở logic cho việc lập luận trên các ký hiệu để xử lý, khai thác được dữ liệu.
Theo hướng này, để mở rộng cơ sở dữ liệu kinh điển thành cơ sở dữ liệu mờ có hai cách tiếp
cận tiêu biểu là mở rộng bằng cách sử dụng quan hệ tương tự và mở rộng theo lý thuyết khả
năng.
Ở Việt Nam, việc nghiên cứu về cơ sở dữ liệu mờ lần đầu tiên được PGS.TS. Hồ Thuần và
PGS.TS. Lê Tiến Vương quan tâm nghiên cứu từ những năm 1985. Các tác giả đã đề xuất
một cách mở rộng mô hình quan hệ bằng cách mở rộng miền trị thuộc tính, xem mỗi miền trị
thuộc tính là một biến ngôn ngữ. Một số kết quả của mô hình quan hệ cũng được mở rộng
trên mô hình này. Năm 1996, Trương Đức Hùng tiếp tục phát triển mô hình này. Năm 2002,
Hồ Cẩm Hà đã mở rộng mô hình cơ sở dữ liệu mờ bằng cách sử dụng quan hệ tương tự và
phát triển một số kết quả cho mô hình này. Năm 2005, Trần Thiên Thành đã mở rộng mô
hình cơ sở dữ liệu mờ dựa trên lý thuyết khả năng, đưa ra được khái niệm phụ thuộc hàm với
lượng từ ngôn ngữ, xây dựng được công thức đánh giá độ tin cậy của các dạng luật tổng kết
dữ liệu.
Những nghiên cứu về cơ sở dữ liệu mờ đang tiếp tục và ngày càng phát triển mạnh mẽ trên

thế giới cũng như ở trong nước. Với mong muốn tìm hiểu về một hướng phát triển và ứng
dụng nó vào thực tiễn, luận văn đề ra nhiệm vụ như sau:
1. Cách tiếp cận để mở rộng Cơ sở dữ liệu kinh điển thành cơ sở dữ liệu mờ được
chọn để nghiên cứu và ứng dụng vào một bài toán cụ thể là cách tiếp cận dựa trên lý
thuyết khả năng (Mô hình dựa trên lý thuyết khả năng).
2. Nghiên cứu xem trên mô hình này, cách thức xử lý thông tin không chắc chắn, mở
rộng các phép toán, mở rộng ngôn ngữ truy vấn dữ liệu rõ (SQL) thành ngôn ngữ
truy vấn dữ liệu mờ (FSQL).
3. Ứng dụng mô hình này vào một bài toán cụ thể.
Luận văn gồm phần mở đầu, 4 chương, kết luận và tài liệu tham khảo.
Chương 1 trình bày các khái niệm cơ bản. Giới thiệu tổng quan về các mô hình cơ sở dữ liệu
mờ.
Chương 2 trình bày cách giải quyết các vấn đề khi mở rộng cơ sở dữ liệu quan hệ thành cơ sở
dữ liệu mờ: vấn đề phụ thuộc hàm mờ, khóa mờ, các dạng chuẩn mờ, tách lượng đồ quan hệ
mờ và dạng chuẩn mờ Boyce Codd.
Chương 3 đi sâu về cách tiếp cận mở rộng cơ sở dữ liệu quan hệ thành cơ sở dữ liệu mờ theo
lý thuyết khả năng. Các cách thức xử lý thông tin không chắc chắn, mở rộng các phép toán
đại số quan hệ trên mô hình mới.
Chương 4 ứng dụng một hướng giải quyết mở rộng ngôn ngữ truy vấn dữ liệu truyền thống
(SQL) thành ngôn ngữ truy vấn dữ liệu mờ (FSQL) và ứng dụng cách tiếp cận đã trình bày
trong chương 3 để giải quyết bài toán quản lý cửa hàng bán lẻ xăng dầu.

References
Tiếng Việt
[1]. Trần Thiên Thành (2002), Phân tách lược đồ cơ sở dữ liệu quan hệ mờ,
Trường Đại học sư phạm Quy Nhơn.
[2]. Hồ Thuần, Trần Thiên Thành (2001), “Phụ thuộc hàm và phụ thuộc đa trị trong
cơ sở dữ liệu quan hệ mờ”, Tạp chí Tin học và điều khiển học, 2001, tập 17 số
2, tr. 13 – 20.
[3]. Đỗ Trung Tuấn (1998), Cơ sở dữ liệu, Nhà xuất bản Giáo dục, Hà nội

[4]. Nguyễn Anh Vũ (2006), Vấn đề chuẩn hóa và tách lược đồ quan hệ trong cơ
sở dữ liệu mờ, Luận văn Thạc sỹ khoa học, Đại học Bách khoa Hà Nội, Hà Nội.
[5]. Lê Tiến Vương (1996), Nhập môn cơ sở dữ liệu quan hệ, Nhà xuất bản khoa
học và kỹ thuật, Hà Nội.

Tiếng Anh
[6]. Frederick E. Petry, “Fuzzy databases Principles and Applications”, Tulane
University-USA, Kluwer Academic Publisher, Boston, 31-179, (1996).
[7]. Ramez Elmasri, Shamkant B. Navathe (2000), Fundamentals of databases
systems, Replika Press Pvt. Ltd., India.
[8]. Shenoi and A.Melton, “Proximity Relation in Fuzzy Relation Databases”, Int,
Jour, Fuzzy Sets and Systems, 31, 287-296, (1989).
[9]. Sozat M.I and Yazici A., “A complete axiomatization for fuzzy functional
and multivalued dependencies in fuzzy database relations”, Elsevier North-
Holland, Inc., Amsterdam, The Netherlands, The Netherlands, 161-181, (2001).
[10]. Jose Galindo, Angelica Urrutia, Mario Piattini, Fuzzy Databases: Modeling,
Design and Implementation. Eds. Idea Group Publishing Hershey, USA, 24-28,
51-54, 147-152, 154-165, (2006)
[11]. Zongming Ma, Fuzzy Database Modeling with XML. Springer, 112-116,
(2005)
[12]. FSQL (Fuzzy SQL) A Fuzzy Query Language,
http://www.lcc.uma.es/~ppgg/FSQL.html

liệu rõ với yếu tố mờ và lan rộng ra miền trị thuộc tính để màn biểu diễn được dữ liệu mờ. Hướng lan rộng ra ngữ nghĩa, dữ liệu vẫn được tàng trữ như quy mô quan hệ, dữ liệu tại cácthuộc tính của những bộ vẫn là dữ liệu rõ nhưng được cho phép khai thác dữ liệu với ngữ nghĩa rộnghơn ( có yếu tố mờ ). Cách tiếp cận này sử dụng sử dụng kim chỉ nan tập mờ để lan rộng ra bằngcách thêm thuộc tính độ thuộc cho mỗi bộ trong quan hệ vào quan hệ. Ví dụ ta hoàn toàn có thể truyxuất một cơ sở dữ liệu nguồn lực của một doanh nghiệp với một câu hỏi như sau : Liệt kênhững người trẻ tuổi trong công ty. Thế nào là trẻ tuổi ?, ta sẽ phải thiết kế xây dựng cơ sở logic choviệc giải quyết và xử lý ngữ nghĩa lan rộng ra của dữ liệu như thế này và kim chỉ nan tập mờ và logic mờ là cơsở để thực thi. Hướng lan rộng ra ngữ nghĩa hoàn toàn có thể vẫn sử dụng những hệ quản trị cơ sở dữ liệuquan hệ sẵn có trong việc tàng trữ dữ liệu, còn những lan rộng ra cho việc giải quyết và xử lý dữ liệu được xâydựng thành những gói riêng, thiết lập thêm, nhúng vào hệ quản trị đó. Tuy nhiên cách mở rộngnày chưa được cho phép tàng trữ dữ liệu mờ nên hạn chế nhiều đến năng lực quản trị dữ liệu thực tiễn. Hướng lan rộng ra miền trị thuộc tính là cách lan rộng ra tổng quát hơn, phản ánh đúng bản chấtcủa yếu tố, nó được cho phép bổ trợ thêm những cú pháp trong trình diễn dữ liệu nhằm mục đích biểu diễnđược dữ liệu mờ. Với cách lan rộng ra này, ngoài việc đưa vào mạng lưới hệ thống ký hiệu còn phải xâydựng được cơ sở logic cho việc lập luận trên những ký hiệu để giải quyết và xử lý, khai thác được dữ liệu. Theo hướng này, để lan rộng ra cơ sở dữ liệu tầm cỡ thành cơ sở dữ liệu mờ có hai cách tiếpcận tiêu biểu vượt trội là lan rộng ra bằng cách sử dụng quan hệ tựa như và lan rộng ra theo triết lý khảnăng. Ở Nước Ta, việc nghiên cứu và điều tra về cơ sở dữ liệu mờ lần tiên phong được PGS.TS. Hồ Thuần vàPGS. TS. Lê Tiến Vương chăm sóc nghiên cứu và điều tra từ những năm 1985. Các tác giả đã đề xuấtmột cách lan rộng ra quy mô quan hệ bằng cách lan rộng ra miền trị thuộc tính, xem mỗi miền trịthuộc tính là một biến ngôn từ. Một số tác dụng của quy mô quan hệ cũng được mở rộngtrên quy mô này. Năm 1996, Trương Đức Hùng liên tục tăng trưởng quy mô này. Năm 2002, Hồ Cẩm Hà đã lan rộng ra quy mô cơ sở dữ liệu mờ bằng cách sử dụng quan hệ tựa như vàphát triển một số ít hiệu quả cho quy mô này. Năm 2005, Trần Thiên Thành đã lan rộng ra môhình cơ sở dữ liệu mờ dựa trên triết lý năng lực, đưa ra được khái niệm phụ thuộc vào hàm vớilượng từ ngôn từ, thiết kế xây dựng được công thức nhìn nhận độ đáng tin cậy của những dạng luật tổng kếtdữ liệu. Những nghiên cứu và điều tra về cơ sở dữ liệu mờ đang liên tục và ngày càng tăng trưởng can đảm và mạnh mẽ trênthế giới cũng như ở trong nước. Với mong ước tìm hiểu và khám phá về một hướng tăng trưởng và ứngdụng nó vào thực tiễn, luận văn đề ra trách nhiệm như sau : 1. Cách tiếp cận để lan rộng ra Cơ sở dữ liệu tầm cỡ thành cơ sở dữ liệu mờ đượcchọn để điều tra và nghiên cứu và ứng dụng vào một bài toán đơn cử là cách tiếp cận dựa trên lýthuyết năng lực ( Mô hình dựa trên triết lý năng lực ). 2. Nghiên cứu xem trên quy mô này, phương pháp giải quyết và xử lý thông tin không chắc như đinh, mởrộng những phép toán, lan rộng ra ngôn từ truy vấn dữ liệu rõ ( SQL ) thành ngôn ngữtruy vấn dữ liệu mờ ( FSQL ). 3. Ứng dụng quy mô này vào một bài toán đơn cử. Luận văn gồm phần mở màn, 4 chương, Kết luận và tài liệu tìm hiểu thêm. Chương 1 trình diễn những khái niệm cơ bản. Giới thiệu tổng quan về những quy mô cơ sở dữ liệumờ. Chương 2 trình diễn cách xử lý những yếu tố khi lan rộng ra cơ sở dữ liệu quan hệ thành cơ sởdữ liệu mờ : yếu tố nhờ vào hàm mờ, khóa mờ, những dạng chuẩn mờ, tách lượng đồ quan hệmờ và dạng chuẩn mờ Boyce Codd. Chương 3 đi sâu về cách tiếp cận lan rộng ra cơ sở dữ liệu quan hệ thành cơ sở dữ liệu mờ theolý thuyết năng lực. Các phương pháp giải quyết và xử lý thông tin không chắc như đinh, lan rộng ra những phép toánđại số quan hệ trên quy mô mới. Chương 4 ứng dụng một hướng xử lý lan rộng ra ngôn từ truy vấn dữ liệu truyền thống cuội nguồn ( SQL ) thành ngôn từ truy vấn dữ liệu mờ ( FSQL ) và ứng dụng cách tiếp cận đã trình bàytrong chương 3 để xử lý bài toán quản trị shop kinh doanh nhỏ xăng dầu. ReferencesTiếng Việt [ 1 ]. Trần Thiên Thành ( 2002 ), Phân tách lược đồ cơ sở dữ liệu quan hệ mờ, Trường Đại học sư phạm Quy Nhơn. [ 2 ]. Hồ Thuần, Trần Thiên Thành ( 2001 ), “ Phụ thuộc hàm và nhờ vào đa trị trongcơ sở dữ liệu quan hệ mờ ”, Tạp chí Tin học và điều khiển học, 2001, tập 17 số2, tr. 13 – 20. [ 3 ]. Đỗ Trung Tuấn ( 1998 ), Cơ sở dữ liệu, Nhà xuất bản Giáo dục đào tạo, Hà nội [ 4 ]. Nguyễn Anh Vũ ( 2006 ), Vấn đề chuẩn hóa và tách lược đồ quan hệ trong cơsở dữ liệu mờ, Luận văn Thạc sỹ khoa học, Đại học Bách khoa TP. Hà Nội, TP. Hà Nội. [ 5 ]. Lê Tiến Vương ( 1996 ), Nhập môn cơ sở dữ liệu quan hệ, Nhà xuất bản khoahọc và kỹ thuật, TP.HN. Tiếng Anh [ 6 ]. Frederick E. Petry, “ Fuzzy databases Principles and Applications ”, TulaneUniversity-USA, Kluwer Academic Publisher, Boston, 31-179, ( 1996 ). [ 7 ]. Ramez Elmasri, Shamkant B. Navathe ( 2000 ), Fundamentals of databasessystems, Replika Press Pvt. Ltd., India. [ 8 ]. Shenoi and A.Melton, “ Proximity Relation in Fuzzy Relation Databases ”, Int, Jour, Fuzzy Sets and Systems, 31, 287 – 296, ( 1989 ). [ 9 ]. Sozat M.I and Yazici A., “ A complete axiomatization for fuzzy functionaland multivalued dependencies in fuzzy database relations ”, Elsevier North-Holland, Inc., Amsterdam, The Netherlands, The Netherlands, 161 – 181, ( 2001 ). [ 10 ]. Jose Galindo, Angelica Urrutia, Mario Piattini, Fuzzy Databases : Modeling, Design and Implementation. Eds. Idea Group Publishing Hershey, USA, 24-28, 51-54, 147 – 152, 154 – 165, ( 2006 ) [ 11 ]. Zongming Ma, Fuzzy Database Modeling with XML. Springer, 112 – 116, ( 2005 ) [ 12 ]. FSQL ( Fuzzy SQL ) A Fuzzy Query Language, http://www.lcc.uma.es/~ppgg/FSQL.html

5/5 - (1 vote)
Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments