Год выпуска: 2013 Автор: Ali Pesaranghader and Norwati Mustapha Издательство: LAP Lambert Academic Publishing Страниц: 124 ISBN: 9783659418976
Описание
With the rapid growth of the Web, finding desirable information on the Internet is a tedious and time consuming task. Focused crawlers are the golden keys to solve this issue through mining of the Web content. In this regard, a variety of methods have been devised and implemented. In this book, we list and categorize these focused crawlers’ methods into different classes by stating cons and pro of each one. Many of these methods, from information retrieval viewpoint, are not biased towards more informative terms in multi-term topics. In this research book also by considering information contents of terms, we propose our Term Frequency-Information Content (TF-IC) method which assigns appropriate weight to each term in a multi-term topic. We show TF-IC outperforms other methods such as Term Frequency-Inverse Document Frequency (TF-IDF) and Latent Semantic Indexing (LSI).
Уважаемая Юлия, здравствуйте, Огромное Вам спасибо за блестяще подготовленные и оформленные доклады и презентации! Вы настоящий профессионал! Читаете без слов мысли и студента, и, самое удивительное, преподавателя (который в данном случае сам плохо знает, что хочет, и постоянно придумывает новые требования и условия Очень здорово сделано и очень интересно. Ещё раз огромное спасибо, в том числе и за срочность!