Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » dtSearch

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12

Открыть новую тему     Написать ответ в эту тему

MrPerfect



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Варезник » dtSearch
 
dtSearch
www.dtsearch.com
 
 

dtSearch Engine — надежный и эффективный поисковый движок с поддержкой баз данных, предназначенный для встраивания в состав веб-сайтов и приложений. Поддерживает программное управление встроенным текстовым парсером с функциями подсветки искомых фрагментов, а также встроенными файловыми конверторами, которые обеспечивают преобразование в формат HTML документов, созданных в OpenOffice, MS Office и целом ряде других популярных приложений. Программа содержит эталонный код и поддержку для ADO, SQL, C++, C++.NET, Java, VB, VB.NET, C#, Delphi, ASP и ASP.NET. Обеспечивает более двух дюжин опций индексированного и неиндексированного текстового поиска для всех популярных типов файлов. Поддерживает полнотекстовый поиск во всех типах поддерживаемых файлов. Имеется также поиск с многократным ранжированием и другие опции сортировки при поиске.
 
dtSearch Desktop — программа, позволяющая искать гигабайты текста за считанные секунды на локальном компьютере, путем создания индекса, хранящего расположение слов в ваших файлах. Программа предлагает функции подсветки искомых фрагментов в найденных документах и поддерживает обширный перечень баз данных почтовых сообщений и файловых форматов. Штатные возможности программы включают более двух десятков функций индексированного, неиндексированного, полнотекстового и структурированного поиска, включая настраиваемый нечеткий поиск, поиск с использованием синонимов, терминов и словарей, логические операторы, ранжирование по релевантности, ранжирование по местоположению, поиск фраз и созвучий, поиск по маске, поиск с учетом порядка следования и взаимного расположения искомых единиц, морфологический поиск, поиск в заданном диапазоне числовых значений, настраиваемые веса искомых единиц. Кроме того, благодаря поддержке Юникода, программа обеспечивает поиск информации на самых разных национальных языках.
 
Возможности программы:
• Прокрутка списка слов для мгновенного отклика после введения поискового запроса
• Функции индексированного, неиндексированного, полнотекстового и структурированного поиска
• Обзор и настройка параметров тезауруса
• Показ всех проиндексированных полей документа с помощью специальной кнопки
• Отображение истории поиска
• Поиск сообщений, показывая хиты в полученных документах
• Опции буфера обмена, запуск файлов и другие инструменты для работы с извлечением данных
• Экспорт результата поиска в различные форматы данных
 
Особенности программы:
• Поиск с использованием морфологии
• Поиск с использованием синонимов
• Нечеткий поиск
• Фонетический поиск
• Поиск в базах данных (через ODBC)
• Поддержка сообщений Outlook
• Поддержка различных кодировок
• Работа в локальной сети
• Индексация веб страниц на заданную глубину

Всего записей: 2342 | Зарегистр. 19-04-2002 | Отправлено: 06:09 09-02-2003 | Исправлено: Komandor, 18:46 29-06-2021
yanko12



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Из обзора на iXBT - у них там на русском морфология работает, звучание и ещё куча всего - и всё на русском !!!
А как они ето добились - непонятно ..
http://www.ixbt.com/soft/search-test.shtml Цитата - ""...dtSearch одна из немногих программ, которая может индексировать веб-страницы на заданную пользователем "глубину" (правда, с учетом "дозакупки" в комплект адд-она dtSearch Spider
...эта программа справилась с индексацией заданного объема информации на уровне с другим конкурсантом - iSYS - и поделила с ним второе место в списке самых быстрых систем. Тестовые 20 гигабайт информации dtSearch проиндексировала за 6 часов 13 минут, создав для нужд последующего поиска индекс размером 7.9 Гб.  
...Во-первых, в dtSearch присутствует морфологический поиск (поиск слова во всех его морфологических формах). Используя данную возможность, вы освобождаете себя от, скажем, таких раздумий, как "в каком же падеже было употреблено некоторое слово в необходимом мне документе?". Использование морфологического поиска почти всегда оправдано, поэтому должно присутствовать в любом профессиональном поисковике.  
Поиск по звучанию является нестандартной возможностью даже для профессиональных поисковиков. Суть его заключается в том, что программа будет искать слова, которые звучат так же, как введенное вами слово. И что самое приятное, эта функция работает и для русского языка! Например, набирая слово "ухо" в поисковом запросе, вы увидите в результате не только слова "ухо", но и "уха".  
Поиск с коррекцией ошибок - очень важная функция. Применяется для поиска слов, содержащих синтаксические ошибки - это могут быть как опечатки, так ошибки в документах, полученных при помощи систем распознавания символов, например. Простой пример - вы ищете слово клавиатура. В некотором документе содержится слово "клавиатупа", очевидно, что на самом деле это слово "клавиатура", просто человек при наборе текста опечатался. Так вот, поиск с коррекцией ошибок, это обнаружит и включит документ со словом "клавиатупа" в результат. Также в dtSearch есть настройка, позволяющая определять степень возможных ошибочных символов.  
Поиск с использованием синонимов. Эта возможность использует список синонимов для различных слов. Так, например, введя слово "быстрый", программа также найдет слова "скоростной" и другие, являющиеся синонимами для слова "быстрый", если таковые, конечно, присутствуют в списке синонимов. Готового списка синонимов вместе с программой dtSearch не поставляется, однако есть возможность воспользоваться списками в Интернет (соответственно, требуется подключение, что не всегда удобно), либо можно составить свой список синонимов.  
Кроме перечисленных возможностей, dtSearch может производить поиск с использованием фраз, состоящих из слов, соединенных логическими операциями. Каждому слову в запросе можно устанавливать свой "вес", то есть значимость. Полезная опция - использование словаря, состоящего из не значимых слов для того, чтобы не учитывать их при поиске, однако этот словарь также пуст и его придется заполнять самостоятельно.  
... никаких специфических возможностей для работы с сетью dtSearch не предлагает. Тем не менее, использовать его в сети вполне возможно. Как вариант, можно создать некоторый индекс и положить его в общедоступную (расшаренную) папку. Саму же программу можно установить каждому пользователю на компьютер, либо выложить ее также на папку, открытую для общего доступа, и создать специальным образом ярлыки для каждого пользователя отдельно, используя параметры командной строки, предназначение которых описано в файле помощи, поставляемым с программой. Также, есть возможность автоматической установки программы в сеть при помощи MSI файла. При этом будут учтены настройки для каждого подключаемого пользователя.  
...Что касается непосредственно поиска документов, то накладок с русским текстом у программы не было. Как не было их ни с заявленной морфологией, ни с нечетким поиском.
Макс Магляс (max.maglyas@softinform.com) Опубликовано — 16 декабря 2005 г.
Обсудить в конференции http://forum.ixbt.com/topic.cgi?id=23:030463

Всего записей: 477 | Зарегистр. 18-01-2005 | Отправлено: 14:37 05-03-2006
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
...Что касается непосредственно поиска документов, то накладок с русским текстом у программы не было. Как не было их ни с заявленной морфологией, ни с нечетким поиском.

Из этого, к сожалению, не следует, что морфология работала именно для русского языка.
Хотя модуль русской морфологии для dtsearch существует...

----------
пропадет-растает

Всего записей: 6792 | Зарегистр. 21-09-2002 | Отправлено: 15:33 05-03-2006
yanko12



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Заостряю внимание на сторчках -  
и ето всё вроде есть но его нет  
 
? в конце - ...Что касается непосредственно поиска документов, то накладок с русским текстом у программы не было. Как не было их ни с заявленной морфологией, ни с нечетким поиском.  
 
? Поиск по звучанию ...эта функция работает и для русского языка! Например, набирая слово "ухо" в поисковом запросе, вы увидите в результате не только слова "ухо", но и "уха".  
 
? Каждому слову в запросе можно устанавливать свой "вес", то есть значимость.  
 

Цитата:
Хотя модуль русской морфологии для dtsearch существует...

А как он называется ?
 
Добавлено:
add -  
http://www.computerra.ru/forum/read.php?FID=24&TID=16674&NID=251438
http://www.cio-world.ru/weekly/231397/page3.html - Корпоративный поиск Автор: Макс Магляс Опубликовано 04 октября 2005 года ... Что касается непосредственно поиска документов, то накладок с русским текстом у программы не было. Как не было их ни с заявленной морфологией, ни с нечетким поиском. Система вполне адекватно находила нужные документы (хоть и с небольшой паузой - 11 гигабайт все-таки).  
http://www.kinnet.ru/cterra/625/251438.html - Обыск местного значения  Автор: Макс Магляс Опубликовано в журнале "Компьютерра" №5 от 07 февраля 2006 года ...Накладок с русским текстом при поиске не было. Как не было их ни с заявленной морфологией, ни с нечетким поиском.
+ !! http://zhurnal.lib.ru/b/brigadir_j_a/text1.shtml - Сильнее напрягает недопонимание программой разных кириллических кодировок. В том же Архивариусе их поддерживается аж 33, из них пять по умолчанию. dtSearch о кодировках, в принципе, знает. Можно выбрать 4 штуки. Но! Не все. А только одну из четырех! Или очень загадочный автодетект. Что он делает - никто не знает. Могу предположить, что он сильно-сильно любит win1251, но не буду божиться.  
  Этот факт сильно снижает значимость мощнейшей, без всякого преувеличения, поисковой машины. Но больше всего лично меня добила неспособность программы хоть как-то заглянуть в CHM файлы! Она выдирает оттуда ровным счетом заголовок и нихрена более.  
+ !! http://www.kpnemo.ru/comment.php?action=usercomms&id=66863 - Русской морфологии как и русского интерфейса нет. Но есть возможность находить похожие слова в любом языке. Также в DtSearch во время набора слова ты видишь, какие слова есть в индексе, а соответственно во всех твоих текстах. Поэтому поиск словоформ необязателен.
Архивариус не лучше и не хуже - он другой. Я им пользовался - мне удобнее DtSearch. выкладывать не буду - Архивариус наприсан российским программистом, стоит около трехсот рублей, и тестовая версия доступна на официальном сайте
Количество форматов, в которых ищут эти программы, одинаковое. А потом у DtSearch есть другие возможности недоступные архивариусу - читать: текст, официальный сайт, изучать программу.
http://zhurnal.lib.ru/comment/b/brigadir_j_a/text1 - Комментарии к Работа с текстом для правильных пацанов, часть 1

Всего записей: 477 | Зарегистр. 18-01-2005 | Отправлено: 07:16 06-03-2006
algol



Newbie
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
А никто не сталкивался с таким вот вопросом:
 
Если пойти вот сюда "Ctrl+S/Browse words/Save List"
и сохранить весь индекс введя например *, а потом посмотреть в файл, то ни в одной из кодировок слова не становяться русскими.
В какой кодировке он их сохраняет??? Я уже и Штирлица пробовал напустить - все равно -- фигу.
 
вот пример текста:
 
█Б┘В╪╣
█Б┘В┘А╪л┘В╪й┘В
█Б┘В┘А╪л┘В╪й┘В╪│
█Б┘Ж┘Л┘З┘М
█Б┘К┘Ж┘Л┘Зe
 
Это в формате DOS;
 
 
 
А это в формате WIN:
 
 
Ы_Щ'Ш┐Щ'ШЄЩ_Ш┐h
Ы_Щ'Ш№
Ы_Щ'Щ_Ш<Щ'ШcЩ'
Ы_Щ'Щ_Ш<Щ'ШcЩ'Ш_
Ы_Щ&#9532;Щ<Щ&#9578;Щ_
Ы_Щ_Щ&#9532;Щ<Щ&#9578;e
 
 
При индексации автодетект и в самой  проге все нормально видно.
 
 
При вставке в форум кодировки поменялись...
 
А было-бы не плохо сделать такой словарик скажем для подбора паролей или еще чего...

Всего записей: 23 | Зарегистр. 20-10-2003 | Отправлено: 04:33 15-03-2006 | Исправлено: algol, 04:40 15-03-2006
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Теперь, как известно, dtSearch поддерживает IFilters. Долго не мог понять, почему я не могу проиндексировать те же *.chm и *.djvu, если соотв. фильтры у меня установлены.
Оказывается в хелпе сказано, что работает он только с query.dll, что, видимо, должно означать отсутствие поддержки сторонних IFilters (не MS).  
Например, отсюда: .http://www.citeknet.com/
или IFilter для *.djvu от LisardTech.
 
Кто-нибудь может сказать, как это ограничение обойти?

----------
пропадет-растает

Всего записей: 6792 | Зарегистр. 21-09-2002 | Отправлено: 02:41 05-04-2006
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dosya
Noise файл использовали?
yanko12
Попробуйте через IFilter настроить.
 
Маленькая сенсация! dtSearch все-таки работает с DJVU, CHM, RAR и пр.
У меня долго не получалось настроить его, т.к. в качестве тестового файла *.djvu я умудрился выбрать именно тот, который dtSearch (на моей системе - у разработчиков тот же файл индексируется нормально) обрабатывать отказывался.
Настраивается все достаточно просто:
   
 
Аналогично настраиваем и CHM. Кто-то говорил, что у него при этом CHM все-равно не индексируется. И тут все просто: нужно убрать *.chm из списка исключаемых по умолчанию (а также в соотв. полях имеющихся индексов):
 

----------
пропадет-растает

Всего записей: 6792 | Зарегистр. 21-09-2002 | Отправлено: 11:55 25-04-2006 | Исправлено: ghosty, 14:04 03-05-2006
eruc



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Можно ли , чтобы dtSearch кроме содержимого файлов также индексировал имена файлов ??

Всего записей: 235 | Зарегистр. 12-10-2002 | Отправлено: 17:23 25-04-2006
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Indexing Options->Index filenames as text

----------
пропадет-растает

Всего записей: 6792 | Зарегистр. 21-09-2002 | Отправлено: 17:42 25-04-2006
vitaly1



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сталкивался ли кто-то с такой проблемой: сабж выделяет не те слова в найденых файлах (при том, что нужные слова в документе тоже есть)? Если было, то как справились?

Всего записей: 5415 | Зарегистр. 28-08-2004 | Отправлено: 00:15 03-05-2006
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vitaly1
1) варианты решения должны быть в их FAQ'е;
2) можно попробовать другую версию (у Вас какая?).

----------
пропадет-растает

Всего записей: 6792 | Зарегистр. 21-09-2002 | Отправлено: 00:27 03-05-2006
vitaly1



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
Да, FAQ читал, там подобная проблема описана. Хотелось узнать, не сталкивался ли кто-то с этим лично. Версия вроде бы 7.23 (стоит на другом компе, сейчас нет возможности глянуть).

Всего записей: 5415 | Зарегистр. 28-08-2004 | Отправлено: 00:40 03-05-2006 | Исправлено: vitaly1, 00:41 03-05-2006
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vitaly1
Странно, Вам решение проблемы нужно, или узнать, сталкивался кто-нибудь или нет?
Я сталкивался. У меня такая картина могла наблюдаться в том случае, когда индекс сделан в одной версии программы, а поиск - в другой (после апгрейда). Все, что нужно при этом сделать - обновить индекс.


----------
пропадет-растает

Всего записей: 6792 | Зарегистр. 21-09-2002 | Отправлено: 00:47 03-05-2006
vitaly1



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
Ясно. Спасибо Конечно решение. Просто не хотелось индексить заново. По крайней мере старая версия вообще не понимала, что такое апдейт индекса - каждый раз начинала создавать его с нуля, несмотря ни на какие установки. Надеюсь, новая это умеет делать.

Всего записей: 5415 | Зарегистр. 28-08-2004 | Отправлено: 00:58 03-05-2006
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vitaly1
Я не помню такой версии, в которой нельзя было бы обновлять индекс. Однако теперь я вспомнил, что для решения проблемы нужно именно перестроить индекс.
Если в окне Update Index установить галочку Clear index before adding documents, индекс будет создан заново, если снять, будет обновляться.
Другие возможные причины неправильного выделения найденных слов (нестрашный глюк, на самом деле, - как правило, выделяются слова где то рядом с найденными ):
    The document was modified since it was indexed
    An indexing setting was changed since the document was indexed
    The document was indexed with a different version of dtSearch
    The document was indexed with the dtSearch Spider, and you are searching using dtSearch Web
    Browser security settings disabled JavaScript
 
Да и не глюк это. Даже не понятно, как в принципе решать эту проблему без перестройки индекса.

----------
пропадет-растает

Всего записей: 6792 | Зарегистр. 21-09-2002 | Отправлено: 10:48 03-05-2006
vitaly1



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
Спасибо. поэкспериментрую. Хотя в моей старой версии (6 с чем-то там) эту галку я тоже снимал/ставил, все равно индексил заново.
 
Да, и спасибо за информацию об IFilter-ах, теперь можно индексить рары и дежавюшки Правда, когда я ему подсунул дежавюшку в раре, такого он уже не вынес и вылетел.

Всего записей: 5415 | Зарегистр. 28-08-2004 | Отправлено: 13:35 03-05-2006
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vitaly1

Цитата:
 Правда, когда я ему подсунул дежавюшку в раре, такого он уже не вынес и вылетел.

Тут у меня создалось впечатление, что глюк не в dtSearch, а в самом айфильтре для дежавю. У меня тоже на одном файле dtSearch вел себя не совсем адекватно (из-за чего я и не мог никак нормально настроить айфильтр). Я отослал этот файл разработчикам, и они намекали, что проблема не с их стороны:
The IFilter is being applied; it is just crashing on the file.  Tracing it in the debugger, dtSearch successfully invokes the DjVu IFilter and asks it to parse the file, and it never returns.
Вообще, служба поддержки у них просто изумительная...

----------
пропадет-растает

Всего записей: 6792 | Зарегистр. 21-09-2002 | Отправлено: 14:02 03-05-2006
Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
шапка включена

----------
Тень превращается в фантазии, таящиеся в глубине вашей души.
Пока идёшь ты среди теней, да не будет зла с тобой.

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 14:48 03-05-2006
vitaly1



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
Не подкинете ссылок на айфильтры? Нашел пока ifilter.org и www.citeknet.com.
 
А у Вас дежавюшки внутри раров индексит?

Всего записей: 5415 | Зарегистр. 28-08-2004 | Отправлено: 15:17 03-05-2006
los2



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vitaly1,
_http://www.ifiltershop.com

Всего записей: 1845 | Зарегистр. 20-11-2001 | Отправлено: 22:26 04-05-2006
Restr



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Маленькая сенсация! dtSearch все-таки работает с DJVU, CHM, RAR и пр.

 
Действительно, после установки IFilter for RAR Archive files
_http://www.citeknet.com/download.aspx?url=ifilters/RAR/Citeknet.RAR.IFilter.Setup-1.5.3.msi
поиск в RAR стал вестись.
 
Подскажите, этот IFilter полностью бесплатный, или имеет ограничения по сроку использования.

Всего записей: 300 | Зарегистр. 31-08-2004 | Отправлено: 09:51 05-05-2006
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12

Компьютерный форум Ru.Board » Компьютеры » Программы » dtSearch


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru