Только без рук)

midian777
На сайте с 07.07.2004
Offline
108
#141

Angelika, не прикалывайтесь... Это не реализуемо. Как минимум Яндексу для этого надо заранее знать при каком запросе какое кол-во документов будет найдено в его индексе. А это нереально....

Нужна тематика, чтобы он мог учитывать её при апдейтах. А не вычислять при запросе к нему.

coding
На сайте с 22.03.2005
Offline
14
#142
midian777:
Angelika, не прикалывайтесь... Это не реализуемо. Как минимум Яндексу для этого надо заранее знать при каком запросе какое кол-во документов будет найдено в его индексе. А это нереально....
Нужна тематика, чтобы он мог учитывать её при апдейтах. А не вычислять при запросе к нему.

ну а если при апдейте, подгружаем самые частые запросы и учитываем связь в них ?

A
На сайте с 19.08.2005
Offline
47
#143

А почему вам всем кажется, что Яндекс должен абсолютно точно определять тематику? Неужели нельзя странице присвоить процентную тематичность (на основе нечеткой логики).

Например, страница состоит из четырех слов: слова математика, геометрия, вИЦ, обезьяна. Почему бы не сказать, что тематика страницы на 50% - математика, на 25 - оптимизация, на 25 - животный мир? И по этим процентам устанавливать фильтры.

Но можно пойти и дальше! Допустим, у нас получилось, что страница может принадлежать 20 тематикам. Можно отбросить те тематики, которые имеют вес меньше 5% - все будет хорошо.

А может вообще в Яндексе идут разработки искуственного интеллекта, чтобы поисковая машина стала похожа на человека. А, Анжелика?

Angelika
На сайте с 19.08.2005
Offline
58
#144
Неужели нельзя странице присвоить процентную тематичность (на основе нечеткой логики)..... страница может принадлежать 20 тематикам.

Это хорошая мысль. Перед тем как сказать, что я думаю на этот счет, вопрос - откуда взялись эти 20 тематик? Кто составил список всех тематик, по которым распихиваем документы?

midian777
На сайте с 07.07.2004
Offline
108
#145
А может вообще в Яндексе идут разработки искуственного интеллекта, чтобы поисковая машина стала похожа на человека. А, Анжелика?

ЛОЛ какой-то :D

ИИ - нереализуемая задача....

Но считать проценты - мысль.

Да, вот, только понять, что считали на пирожках всё-равно не получится.... Получится энный процент кулинарной темы, а тематика документа останется вне поле зрения.

A
На сайте с 19.08.2005
Offline
47
#146

Angelika, тематики берутся либо из каталога Яндекса, либо из его тематических словарей.

midian777 А зачем нам тематика? Нам важно только процентная принадлежность к тематике. Ведь правильно говорят - достоверно тематику определить невозможно.

midian777
На сайте с 07.07.2004
Offline
108
#147
Нам важно только процентная принадлежность к тематике.

Не скажи....

Запросто напишу небольшой рассказ с привалирующим процентом кулинарной тематики. :) А на самом деле тематика будет - любая! На выбор!

--------------------

1. Точно и достоверно определить тематику - нереально.

2. Для ранжирования можно определять совпадения слов, процент совпадений и кол-во вхождений как в документе в целом, так и в ссылках в частности. Но назвать это тематикой или темой - нереально.

-------------------

Пора заканчивать...

Ceres
На сайте с 28.09.2004
Offline
389
#148

Ну развели флейму. Вон - вольф написал правду-матку аж на 3-ей странице - дальше можно было не писать ничего ;)

Там чу-де-са! )
midian777
На сайте с 07.07.2004
Offline
108
#149
дальше можно было не писать ничего

А поговорить? ;)

[Удален]
#150

Почему ? А дальше развели нормальный флуд со взаимными наездами :) Учитывая, что то, что сказал вольф, было известно давно (причем всем, ну кроме дартаньяна, конечно :) ).

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий