Key Collector - автоматизированная система анализа семантического ядра. Часть 8.

КВ
На сайте с 02.07.2012
Offline
47
#491

Можно какнибудь удалить дубли ключей тех которые уже имеются на сайте из тех которые напарсил?

MIND
На сайте с 08.03.2007
Offline
238
#492
103:
можно как-то при парсинге слов, сразу фильтровать фразы содержащие города?
(например задать список слов, при наличии которых не добавлять в список фразу)

Нет, но можно отфильтровать после.

---------- Добавлено 23.08.2012 в 22:16 ----------

Кот в сапогах:
Можно какнибудь удалить дубли ключей тех которые уже имеются на сайте из тех которые напарсил?

Дублей быть не должно. Возможно, это у Вас просто слова с невидимыми пробельными символами или в другой кодировке. Пришлите, пожалуйста, демо-проект в тикеты с этими фразами, чтобы мы смогли сказать точнее.

Key Collector - автоматизированная система анализа семантического ядра (/ru/forum/863504)
КВ
На сайте с 02.07.2012
Offline
47
#493
MIND:

Дублей быть не должно. Возможно, это у Вас просто слова с невидимыми пробельными символами или в другой кодировке. Пришлите, пожалуйста, демо-проект в тикеты с этими фразами, чтобы мы смогли сказать точнее.

Вы меня не поняли немного. Можно сравнить те ключи которые я напарсил с теми которые у меня уже на сайта (в сети).

Другими словами - на сайте уже 1к. тематических ключей и напарсил 1к. Можно их сравнить и исключить дубли?

KN
На сайте с 04.07.2011
Offline
74
k1N
#494

Как можно быстро собрать частотности ! у 20-30к слов ?

Еще хотел бы спросить, нет ли случайно разных наборов габлонов вида ? Под сбор ключей, расчёт стоимости продвижения, перспективы посещаемости и т.д. ?

КВ
На сайте с 02.07.2012
Offline
47
#495

k1N, Через прокси, как еще та? Вот у них даже написано это:


Программа поддерживает работу с сервисом SeoProxy (http://seo-proxy.ru).
Настроив программу на работу с данным сервисом, Вы можете быстро снимать данные с Yandex.Wordstat и поисковой выдачи ПС Яндекс без капчи.
KN
На сайте с 04.07.2011
Offline
74
k1N
#496
Кот в сапогах:
k1N, Через прокси, как еще та? Вот у них даже написано это:

Дело не в каптче, а в быстроте сбора.

MIND
На сайте с 08.03.2007
Offline
238
#497
k1N:
Дело не в каптче, а в быстроте сбора.

Скорость сбора напрямую зависит от количества активных потоков. Для поддержания большого кол-ва потоков желательно иметь равное или большее кол-во прокси-серверов, чтобы снизить вероятность бана.

---------- Добавлено 24.08.2012 в 13:29 ----------

Кот в сапогах:
Вы меня не поняли немного. Можно сравнить те ключи которые я напарсил с теми которые у меня уже на сайта (в сети).

Другими словами - на сайте уже 1к. тематических ключей и напарсил 1к. Можно их сравнить и исключить дубли?

Напишите в тикеты более подробно. То, что Вы описали, можно сделать, не проводя вообще никаких манипуляций дополнительных, т.к. по умолчанию в программе вырезаются дубли. Если это не то, то можно в том же Excel или Access сделать очень быстро.

KN
На сайте с 04.07.2011
Offline
74
k1N
#498

Бан идет по IP ?

MIND
На сайте с 08.03.2007
Offline
238
#499
k1N:
А что на счёт этого вопроса ?
Бан идет по IP ?

В вордстате - да.

KN
На сайте с 04.07.2011
Offline
74
k1N
#500

Еще хотел бы спросить, нет ли случайно разных наборов габлонов вида ? Под сбор ключей, расчёт стоимости продвижения, перспективы посещаемости и т.д. ?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий