Abstract:
Bilgi ajanlarının çoğunlukla kullanıldığı alanlardan birisi de elektronik ticarettir. Elektronik ticaretin bölümlerinden biri olan işletmelerden müşterilere yönelik ticaretteæ fiyat, renk, ebat, vb. gibi ürün özellikleri hakkında bilgi içeren web sayfaları, müşterilerin daha bilinçli alışveriş yapmalarını sağlar. Binlerce web sayfasını incelemek müşteriler için imkansız olacağından, akıllı bilgi ajanları, İnternet üzerindeki verilerin toplanması, işlenmesi ve anlamlı sonuçlar olarak müşterilere sunulmasında başlıca rolü oynamaktadır. Bu tez, ardışık kelime frekanslarına dayanan yeni bir bilgi çıkarımı algoritmasını ve İnternet üzerindeki bilgi kazanımını sağlayıp otomatik olarak bilgi tabanını inşa eden akıllı bir ajan tasarımını ile uygulamasını içerir. Algoritmayı değerlendirmek için FERbot (Feature Extractor Recognizer Bot: Özellik Çıkarıcı Tanımlayıcı Robot) adında akıllı bir ajan tasarlandı. FERbot, İnternet üzerindeki yapılandırılmamış yada yarı yapılandırılmış internet sayfalarından etiketlendirilmiş yada etiketlendirilmemiş verileri toplayarak ürünlerin özelliklerini ve bu özelliklerin değer aralıklarını müşterilere bildirerek daha bilinçli ve tutarlı alışveriş yapmalarını sağlar. Bu yeni algoritma, web üzerinden bilgi çıkarımı yapan mevcut algoritmalara bir alternatif olduğu gibi veri madencilerinin ve doğal dil işleyicilerinin, metinlerden çıkarılmış bilgileri işlemelerinde önemli rol oynayacaktır. One of the mostly used areas of information agents is electronic commerce. At business to customer commerce which is one of the parts of electronic commerce, web pages including information about properties of products such as price, color, size, etc. enable customers to be more conscious to shop. Because of browsing thousands of web pages will be impossible for customers, intelligent information agents play essential role for collecting, processing data in Internet and producing meaningful results for customers. This thesis includes a new information extraction algorithm which is based on frequencies of sequential word groups, and design and application of an intelligent agent that acquire knowledge from Internet to automatically build a knowledge base. To evaluate the algorithm, an intelligent agent which is called FERBot (Feature Extractor Recognizer Bot) is designed. FERbot collects the labeled or unlabeled information from structured or unstructured web pages to inform customers about the features of products and value range of these features for reasonable and cost efficient shopping. This new algorithm is an alternative for the current information extraction algorithms that extract information from web. It plays an important role for text miners and natural language processors to process the extracted information.