Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » dtSearch

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12

Открыть новую тему     Написать ответ в эту тему

MrPerfect



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Варезник » dtSearch
 
dtSearch
www.dtsearch.com
 
 

dtSearch Engine — надежный и эффективный поисковый движок с поддержкой баз данных, предназначенный для встраивания в состав веб-сайтов и приложений. Поддерживает программное управление встроенным текстовым парсером с функциями подсветки искомых фрагментов, а также встроенными файловыми конверторами, которые обеспечивают преобразование в формат HTML документов, созданных в OpenOffice, MS Office и целом ряде других популярных приложений. Программа содержит эталонный код и поддержку для ADO, SQL, C++, C++.NET, Java, VB, VB.NET, C#, Delphi, ASP и ASP.NET. Обеспечивает более двух дюжин опций индексированного и неиндексированного текстового поиска для всех популярных типов файлов. Поддерживает полнотекстовый поиск во всех типах поддерживаемых файлов. Имеется также поиск с многократным ранжированием и другие опции сортировки при поиске.
 
dtSearch Desktop — программа, позволяющая искать гигабайты текста за считанные секунды на локальном компьютере, путем создания индекса, хранящего расположение слов в ваших файлах. Программа предлагает функции подсветки искомых фрагментов в найденных документах и поддерживает обширный перечень баз данных почтовых сообщений и файловых форматов. Штатные возможности программы включают более двух десятков функций индексированного, неиндексированного, полнотекстового и структурированного поиска, включая настраиваемый нечеткий поиск, поиск с использованием синонимов, терминов и словарей, логические операторы, ранжирование по релевантности, ранжирование по местоположению, поиск фраз и созвучий, поиск по маске, поиск с учетом порядка следования и взаимного расположения искомых единиц, морфологический поиск, поиск в заданном диапазоне числовых значений, настраиваемые веса искомых единиц. Кроме того, благодаря поддержке Юникода, программа обеспечивает поиск информации на самых разных национальных языках.
 
Возможности программы:
• Прокрутка списка слов для мгновенного отклика после введения поискового запроса
• Функции индексированного, неиндексированного, полнотекстового и структурированного поиска
• Обзор и настройка параметров тезауруса
• Показ всех проиндексированных полей документа с помощью специальной кнопки
• Отображение истории поиска
• Поиск сообщений, показывая хиты в полученных документах
• Опции буфера обмена, запуск файлов и другие инструменты для работы с извлечением данных
• Экспорт результата поиска в различные форматы данных
 
Особенности программы:
• Поиск с использованием морфологии
• Поиск с использованием синонимов
• Нечеткий поиск
• Фонетический поиск
• Поиск в базах данных (через ODBC)
• Поддержка сообщений Outlook
• Поддержка различных кодировок
• Работа в локальной сети
• Индексация веб страниц на заданную глубину

Всего записей: 2342 | Зарегистр. 19-04-2002 | Отправлено: 06:09 09-02-2003 | Исправлено: Komandor, 15:29 16-11-2022
erziman



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Никто не посоветует как организовать просмотр картинок не открывая DOC документ, в HTML документах такая возможность присутствует

Всего записей: 190 | Зарегистр. 30-04-2008 | Отправлено: 13:46 11-11-2011
suomifinland



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я так поняла, как любая поисковая система dtSearch  создает индексную базу на диске С:
Вопрос, есть ли в программе dtSearch  возможность переноса базы индекса на другой, локальный диск?

----------
Мы на горе всем буржуям, мировой пожар раздуем... А.Блок.

Всего записей: 5257 | Зарегистр. 16-04-2006 | Отправлено: 12:05 05-02-2012
231930

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
suomifinland
Не об этом ли речь?

Цитата:
В dtSearch в меню Index есть менеджер индексов Index Manager. В нём и производится основная работа с индексами. Если нажать Create Index (Создать индекс) будет предложено ввсети его название, затем расположение - можно выбрать стандартное, где все индексы, либо указать новое. После этих действий паоявляется окно Update Index

Всего записей: 942 | Зарегистр. 05-05-2011 | Отправлено: 12:20 05-02-2012
erziman



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
suomifinland
Да есть как при создании индекса, так и после переноса имеющегося индекса - достаточно выбрать в index manager @recognize index@ и указать путь к индексу

Всего записей: 190 | Зарегистр. 30-04-2008 | Отправлено: 13:31 05-02-2012
Falanster



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я так поняла, как любая поисковая система dtSearch  создает индексную базу на диске С:  
 Вопрос, есть ли в программе dtSearch  возможность переноса базы индекса на другой, локальный диск?


Цитата:
Да есть, как при создании индекса, так и после переноса имеющегося индекса - достаточно выбрать в index manager @recognize index@ и указать путь к индексу

 
Тут есть одна загвоздка:
Изначально, при создании Индекса можно пойти 2 путями (объясню простыми словами):  
1 - создать просто индекс документов;
2 - создать индекс документов с копией этих документов.

 
Рассмотрим 1-ый путь. Допустим, Вы создали индекс, который проиндексировал все Ваши ежемесячные отчёты в формате *.doc (*.docx), накопленные за несколько лет. Затем из папки Вы удалили старые отчёты за 2005 год. Ну, правда, зачем хранить такие старые отчёты?
Спустя несколько дней возникла задача, найти пару старых показателей за 2005 год. Запустили DTSearch. Как Вы думаете он найдёт данные из физически удалённых файлов? Нет.  
DTSearch создаёт своего рода "базу данных" (Индекс), в которой хранятся сведения о том, где, на каких дисках, в каких папках, в каких документах, на какой строке конкретного документа расположено то или иное слово, цифра, их сочетания.
 
Рассмотрим 2-ой путь. Здесь при создании Индекса, происходит тоже самое, только кроме этого DTSearch сохраняет в свою "базу данных" (Индекс) полную копию каждого документа. Поэтому, даже если Вы удалите этот документ, то при поиске через DTSearch увидите его копию и данные, которые в нём находились.
Безусловно, изначально создание такого Индекса будет проходить намного дольше по времени.
 
Теперь вернёмся к обозначенному вопросу: "есть ли возможность переноса базы индекса на другой, локальный диск?"
Если Индекс создавался по 1-му пути, то, перенеся Индекс с одного компьютера на ноутбук, Вы ничего не получите.
Если Индекс создавался по 2-му пути, то при переносе все данные сохранятся.


Всего записей: 113 | Зарегистр. 12-04-2008 | Отправлено: 22:23 17-03-2012 | Исправлено: Falanster, 22:28 17-03-2012
yanko12



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите , как его заставить индексировать содержимое " __.torrent " - файлов ? В них внутре содержится в текстовом виде название скачанного с торрентов . а то уже не разберусь что когда и куда скачивал, на винте имеется полно веб-страничек и соответствующих " __.torrent " - файлов

Всего записей: 477 | Зарегистр. 18-01-2005 | Отправлено: 17:05 12-05-2012
Falanster



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
yanko12
После создания индекса происходит добавление в него документов. На этом этапе можно указать типы файлов, которые будут индексироваться и типы файлов, которые будут пропускаться, своего рода фильтр. Можно попробовать добавить расширение *.torrent в список индексируемых файлов.

Всего записей: 113 | Зарегистр. 12-04-2008 | Отправлено: 22:59 12-05-2012 | Исправлено: Falanster, 23:00 12-05-2012
jonnydepp

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
получается ли индексирование djvu в Windows 7 64? когда-то работало, а сейчас - нет. файлы индексируются как Filtered Binary и не читабельны. Ifilter от  
http://www.caminova.net/en/downloads
 
спасибо

Всего записей: 31 | Зарегистр. 29-11-2005 | Отправлено: 17:15 11-11-2012
anynamer



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А она может создавать поиск по локальному сайту или для CD?

Всего записей: 2241 | Зарегистр. 17-05-2010 | Отправлено: 03:28 16-11-2012
Arech

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Прошу прощения, наверное, уже обсуждалось, но не смог найти ответа на след. 2 вопроса. Если не сложно, подскажите, пожалуйста, или хоть ссылки где читать...
 
1) Как у субжа с русской морфологией? Поддерживает её? Если нет, насколько это усложняет поиск?
 
2) Кто-нибудь сравнивал качество поиска на больших коллекциях с Архивариусом 3000? Последний крайне не устраивает именно этим и ищу замену.
 
Спасибо

Всего записей: 169 | Зарегистр. 28-12-2005 | Отправлено: 21:59 04-12-2012
Falanster



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
1) Как у субжа с русской морфологией?

Поясни, что имеешь ввиду. Поиск по русскоязычному контенту? Или поиск словоформ и т.п. (типа Яндекса)? Русскоязычные документы DTSearch обрабатывает прекрасно.
 

Цитата:
2) Кто-нибудь сравнивал качество поиска на больших коллекциях с Архивариусом 3000?

Не совсем понятно, что ты имешь в виду под выражением "большая коллекция"?
Поищи, в просторах сети есть обзоры, посвященные сравнению программ такого рода. Приводится даже сравнение по времени построения индексов.  

Всего записей: 113 | Зарегистр. 12-04-2008 | Отправлено: 19:33 05-12-2012
Arech

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Поясни, что имеешь ввиду. Поиск по русскоязычному контенту? Или поиск словоформ и т.п. (типа Яндекса)?

Да, именно понимание словоформ, хотя бы в простейшем виде - всяких окончаний, падежей и т.д.
 

Цитата:
Не совсем понятно, что ты имешь в виду под выражением "большая коллекция"?

Ну, вот в индексе на 3.5Gb архивариус ищет просто безобразно и часто выдаёт совершенно не релевантные результаты. Может быть оттого, что судя по всему для архивариуса любой документ индексируется как plain text, т.е. он ничего не знает ни о заголовках глав книг, ни о названиях параграфов, ни о вообще каком-бы то ни было форматировании - соответственно эту важнейшую для правильного ранжирования информацию он не использует.
Меня вот интересует, сравнение качества поиска с субжем. И я даже согласен на любой размер коллекции, лишь бы нормальное сравнение было.
 

Цитата:
Поищи, в просторах сети есть обзоры, посвященные сравнению программ такого рода.

Нуёма, кэп, ты?  А я-то сразу не признал!)))
 
Писал же с самого начала - искал, но ничего удобоваримого не нашёл, поэтому и спросил тут, может кто знает...  
 
зы: скорость построения индекса - последнее, что интересует в вопросе качества поиска.

Всего записей: 169 | Зарегистр. 28-12-2005 | Отправлено: 20:13 05-12-2012 | Исправлено: Arech, 20:14 05-12-2012
Falanster



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arech
 
http://searchinform.ru/press/articles/179/
 
http://www.i2r.ru/static/379/out_12360.shtml

Всего записей: 113 | Зарегистр. 12-04-2008 | Отправлено: 21:35 05-12-2012
laprad

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arech
 
рекомендую глянуть на Copernic Desktop Search  http://www.copernic.com/en/products/desktop-search/home/index.html  - страничка бесплатной версии.  если бы пришлось сваливать с архивариуса, я бы перешел бы на нее (если память не изменяет, подерживает украинский язык, мне это важно). А обозревальщики, однако, ее "не замечают"..

Всего записей: 392 | Зарегистр. 19-01-2009 | Отправлено: 22:08 05-12-2012
Arech

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Falanster, laprad - спасибо большое за ссылки, ща буду изучать!
 
laprad, а архивариус вас устраивает?
 
 
 
Добавлено:
Нда-с, Falanster, ни по одной ссылке Архивариус даже не упоминается (я уж не говорю, что все обзоры старые как х.з. что). Всё это барахло.
 
Ну что, неужели никто субж с Архивариусом не сравнивал?...

Всего записей: 169 | Зарегистр. 28-12-2005 | Отправлено: 22:52 05-12-2012 | Исправлено: Arech, 23:23 05-12-2012
laprad

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arech
 
устраивает, с ним и сижу пока, потому как я уже говорил, мне важен украинский язык+ архивариус поддерживает много типов архивов.  меня не устраивает логика и точность поиска - то есть то же, что и тебя.
 

Цитата:
Ну что, неужели никто субж с Архивариусом не сравнивал?...

ну вот поставил DtSearch Desktop, натравил на 7 доков, знание про морфологию заменено опцией "Fuzzy searching"(типа, нечёткий поиск), значения которой (от пустого до 10 символов (?)) скорее всего означают на сколько букв может отличаться искомое слово, чтобы попасть в результат. Соседняя опция "Phonic searching" сама по себе считает "елетронний" и "електронних" не похожими друг на друга, поиск по "електронни*"   нашел оба слова
прога имеет право на жизнь но, имхо, толстовата, и, ТЕОРЕТИЧЕСКИ, менее приспособлена к кириллице и славянским языкам, чеи архивариус. тестил пару минут, хелп не читал, кто юзает больше скажет
 
Добавлено:
еще не понравилось, что в DtSearch Desktop нужно дабл-кликать на документе в списке с результатами поиска, чтобы увидеть его содержимое в быстром просмотре, но. возможно, это можно настроить. лично мне удобнее видеть содержимое при смене фокуса

Всего записей: 392 | Зарегистр. 19-01-2009 | Отправлено: 00:24 07-12-2012 | Исправлено: laprad, 00:25 07-12-2012
Falanster



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Ну что, неужели никто субж с Архивариусом не сравнивал?

Сравнивал, по мне - Архивариус нервно курит в сторонке. Ставил его после долгого использования ДСПИ "Cros", затем DTSearch.  
Так вот - скачал его из любопытства, сделал пару тестовых запусков и удалил. Не пошло, мне показалось - тускло, однобоко и невыразительно. Моё мнение основано исключительно на первом впечатлении. Инструментарий основательно не тестировался.  
Безусловно, две проги имеют полное право на существование.
Для моих нужд больше подходит Крос, но он серьёзно устарел и только совсем недавно выпустил новый релиз. Поэтому в своё время я пересел с него на DTSearch. Релизы постоянны, но вначале пришлось самостоятельно разбираться с настройками и принципами работы.
Ещё понравилась программа SearchInform - вот это продукт. Есть серверная часть и клиентская. Но ОЧЕНЬ ДОРОГО.
 

Цитата:
Нда-с, Falanster, ни по одной ссылке Архивариус даже не упоминается (я уж не говорю, что все обзоры старые как х.з. что). Всё это барахло.

Признаю, обзоры старые, но полезную информацию при желании почерпнуть можно... И про DTSeach почитать. Если Архиваруис в них не упоминается, это не даёт повода обсерать их и мою помощь =)

Всего записей: 113 | Зарегистр. 12-04-2008 | Отправлено: 23:21 07-12-2012 | Исправлено: Falanster, 23:43 08-12-2012
laprad

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Архивариус нервно курит в сторонке. Ставил его после долгого использования ДСПИ "Cros", затем DTSearch.  
Так вот - скачал его из любопытства, сделал пару тестовых запусков и удалил. Не пошло, мне показалось - тускло, однобоко и невыразительно

как-то уж слишком субъективно.. примеры бы не помешали
мои примеры - и DtSearch и архивариус умеют показывать список слов и кол-во их вхождений в проиндексированые тексты - прикольно, но, например, сможет ли DtSearch сделать поиск похожих текстов (процент схожести можно выбирать)?  приятная фича, для поиска плагиата может и не подходит, но полезно при поиске дубликатов файлов в разных форматах и/или с пустяковыми отличиями
сравнивать поддержку архивов/почтовых баз особого смысла не вижу - главное чтобы zip, rar и arj видели, ну может 7z еще, сотни поддерживаемых форматов/расширений архивов у архивариуса вызывают огромнейшее уважение к программерам, которые все это впихнули в 6-метровый инстал, но не более (опять же, у меня)
обе проги я так понимаю поддерживают создание сервака на компе с "библиотекой"  + "голые" клиенты у юзеров (архивариус так точно)
что не нравится у обеих - платные, заразы, но и тут, порядок цен ОЧЕНЬ отличается, соотношение фичастость/цена, имхо, не в пользу DtSearch.  да, я знаю про гугл и соседние темы

Всего записей: 392 | Зарегистр. 19-01-2009 | Отправлено: 02:26 08-12-2012 | Исправлено: laprad, 02:29 08-12-2012
Falanster



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arech
Вот неплохое сравнение поисковых программ:
 
http://forum.ru-board.com/topic.cgi?forum=5&topic=7321&start=100
 
и более развёрнутое - http://filospecan.easyforum.ru/viewtopic.php?id=61

Всего записей: 113 | Зарегистр. 12-04-2008 | Отправлено: 15:48 08-12-2012
Falanster



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
как-то уж слишком субъективно

Согласен, был слишком эмоционален в оценке. Архивариус - программа довольно не плохая. Но, так как топик не о возможностях Архивариуса, а о DTSearch, то в продолжении темы напишу, для каких целей использовал DTSearch и что больше всего понравилось в программе.
 
На сервере валом валялась куча архивных документов (справки, аналитические отчёты и материалы, копии выкачанных Интернет-сайтов и телефонные справочники в MS Excel и Word). Решил организовать поиск по архивным документам. Отсортировал все документы по группам, выделив несколько тематических папок.  
 
Используя DTSearch, создал несколько индексов. Поковырялся в настройках программы. Начал тестировать поиск и настраивать отображение полученных результатов. На моё удивление программа показала неплохие результаты, особенно благодаря функции булевого поиска. Привлекала внимание возможность выбора нескольких поисковых операторов и их комбинация. Особенно порадовало то, что можно было задавать расстояние между поисковыми словами (такая фишка реализована в Яндексе и отсутствует в Google).
 
***
Это можно прочувствовать при поиске лица с такой очень распространённой фамилией, как Иванов, но именем Григорий.
Архивариус выдал мне 85 документов, DTSearch - 3 (проверялось на небольшом индексе).  
При рассмотрении результатов выбранных Архивариусом, оказалось, что он нашёл все документы, в которых встречаются оба эти слова, но только в одном упоминалось искомое лицо. Т.е. в результаты поиска он выдал и те документы, в которых два поисковых слова были сильно разбросаны. В начале текста стояла фамилия Иванов, а в конце текста Григорий, речь шла о разных людях.
DTSearch выдал 3 документа, в одном из которых шло упоминание о нужном лице.  
Не сложно представить, сколько времени займёт просмотр и анализ 85 документов и сколько просмотр 3-х документов. Далее представим, что в день мы ищем не одного человека, а больше. Это касается не только поиска лица, но и поиска фактов, адресов, организаций и другой информации.  
***
 
Это стало определяющим фактором. Другим определяющим фактором стала возможность работы с индексами по сети.  
 
Несколько слов об Архивариусе и DTSearch.
1.DTSearch не может искать в найденном, не использует правила транслитерации, не учитывает латинские буквы, схожие по написанию с русскими, не учитывает цифры, похожие на буквы (как это сделано в Архивариусе). Но при желании почти всего этого можно добиться в DTSearch, используя поисковые маски и булев поиск.
2.Сначала очень интересной показалась возможность Архивариуса извлекать из текстовых массивов разные данные, особенно номера телефонов. Но потом я понял, что никуда их не привяжу, ни к конкретным лицам, ни к организациям. А список телефонов и количество их упоминаний в индексе, всё это само по себе не слишком информативно. Единственное, что было бы полезно, так это извлечение почтовых адресов из всех текстовых документов (e-mail). И то полезно только спамерам для рассылки. Понравилась возможность получить словоформы любого слова, т.е. посмотреть в каком виде они стречаются в индексе (ум - ума, умом, умы ...), но найти практического применения этой фишки к решению своих задач не смог.

Всего записей: 113 | Зарегистр. 12-04-2008 | Отправлено: 23:08 08-12-2012 | Исправлено: Falanster, 23:45 08-12-2012
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12

Компьютерный форум Ru.Board » Компьютеры » Программы » dtSearch


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru