Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » WinRAR (часть 3)

Модерирует : gyra, Maz

Maz (27-08-2020 19:31): WinRAR (часть 4)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
По вопросам лечения (кряки, патчи и т.д.), а также разблокировки архивов, обращаемся в «Варезник».
Отдельная тема по сборкам WinRAR
Предыдущие части темы: Часть 1 | Часть 2



Официальный русский сайт: win-rar.ru
Официальный e-mail разработчика WinRAR (писать на русском): dev@rarlab.com
 
Финальная английская версия: 5.91 x86 | x64 (29.06.2020)
Финальная русская версия:  5.91 x86 | x64 (29.06.2020)
 
Список изменений на английском языке
(на родном – смотрите файл WhatsNew.txt в дистрибутиве на вашем языке)
Скачать RAR для macOS, FreeBSD, Linux, Android можно здесь.

 
Скачать ранее вышедшие версии также можно с официального сайта.

Версия 3.62 (ru) с подарочным ключом (респект камраду elmorte)

Коллекция всех ранее выходивших версий WinRAR (1995-2020): скачать (253 МБ) [обновлено 30.03.2020]

вместо F.A.Q. || альтернативные архиваторы

Почему опять задерживается русская версия? А при русском разработчике на языке XXX уже давно есть. Не захламляйте тему подобными вопросами.

Кому не нравится новая тема оформления - скачайте с официального сайта rarlab.com (из раздела Themes) и установите себе WinRAR Classic theme by Francesco Indrio: Стандартная (48x36). Мелкие кнопки (24x24)

В теме активно отвечает на вопросы автор архиватора Евгений Рошал! Ситуация уникальная, прошу пользоваться. :)

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 12:00 14-12-2016 | Исправлено: Domin0, 13:37 26-08-2020
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
persicum

Цитата:
Насколько я понимаю, в WinRAR 5.xx дедупликация присутствует только на уровне файлов одинаковой длины?  

если вы о "Save identical files as references.", то это не так.

Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 11:51 13-06-2020
Gnomi

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
persicum

Цитата:
Очень бы хотелось иметь дедупликацию на уровне нутра файлов

Тогда вам при архивации надо покрыть длиной словаря все те файлы ,"нутра" которых вы хотите дедублицировать. Именно для попадания похожих файлов в длину словаря и делается их сортировка перед непрерывной "солид" архивацией.
 
Но, насколько я понимаю, у вас ещё много мыслей по будущим форматам архивов. С нетерпением ждем ценных идей и пояснений.

Всего записей: 48 | Зарегистр. 24-12-2005 | Отправлено: 11:54 13-06-2020 | Исправлено: Gnomi, 11:54 13-06-2020
GoblinNN

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
persicum

Цитата:
можно подумать и о формате RAR6

зачем? накрутить rar-zstd?  
да тут еще можно добавить. например в winrar в окошко "конвертировать" всунуть настройки оптимизации и перебирать файлы разными алгоритмами. ну это для тех кому производительность не очень важна.
ну прям как тут.
только я что заметил с этой програмкой. архивы рар4 получаются меньше размером. и в основном на выходе rar4 выходит. может из-за сжатия текста?

Всего записей: 2908 | Зарегистр. 11-10-2005 | Отправлено: 11:54 13-06-2020
Pasha_ZZZ



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Gnomi
Человек, видимо, хочет аналог srep, встроенный в rar

Всего записей: 12398 | Зарегистр. 11-03-2002 | Отправлено: 12:17 13-06-2020
insorg



Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Pasha_ZZZ
srep в winrar?
Shut up and take my money!

Всего записей: 16668 | Зарегистр. 04-11-2010 | Отправлено: 13:19 13-06-2020
persicum

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Но, насколько я понимаю, у вас ещё много мыслей по будущим форматам архивов. С нетерпением ждем ценных идей и пояснений.

 
Ну смотри...
Имеем 8 штук iso-шек по 3G каждая, всего 24 гига. Содержание образов ПРИМЕРНО одинаковое, так как это разные версии одного и того же.
 
Начинаем паковать...
WinRAR - good, solid, 1024M словарь - получаем архив 18 гигов.
ZPaq - все по дефолту - получаем архив 3.6 гига.
 
Вот для того, чтобы пользоваться одним архиватором на все случаи жизни, нужен новый формат RAR6 - с дедупликацией.

Всего записей: 462 | Зарегистр. 27-06-2007 | Отправлено: 14:52 13-06-2020
insorg



Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
persicum
А если брать не iso, а набор разного размера файлов с примерно похожим содержанием? При том у нас всё также соблюдается условие, что "идентичные" и "схожие" данные находятся на расстоянии больше размера словаря.
Как бы это не было заманчиво, но попытка прыгнуть выше головы?

Всего записей: 16668 | Зарегистр. 04-11-2010 | Отправлено: 20:05 13-06-2020
Fenrizz



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
insorg
 

Цитата:
Deduplication
 
When adding files, zpaq uses a rolling hash function to split files into fragments with an average size of 64 KB along content-dependent boundaries. Then it computes the SHA-1 hash of the fragment and compares it with saved hashes from the current and previous versions. If it finds a match then the fragment is not stored.  

 
Файл разбивается на блоки, для каждого блока вычисляет хэш и сохраняется в таблице, при добавлении новых файлов они тоже разбиваются на блоки, вычисляются их хэши и сравниваются с теми, что уже есть в архиве, если совпадает, то вместо блока в архив добавляется его запись в таблице хэшей.

Всего записей: 677 | Зарегистр. 12-09-2017 | Отправлено: 20:11 13-06-2020 | Исправлено: Fenrizz, 20:18 13-06-2020
EugeneRoshal

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
persicum

Цитата:
Насколько я понимаю, в WinRAR 5.xx дедупликация присутствует только на уровне файлов одинаковой длины?

+solid в пределах sliding dictionary.
 
GoblinNN

Цитата:
только я что заметил с этой програмкой. архивы рар4 получаются меньше размером. и в основном на выходе rar4 выходит. может из-за сжатия текста?

Скорее всего. Степень сжатия у PPMd хорошая. Сложности были со скоростью распаковки и распараллеливанием упаковки.
 
persicum

Цитата:
Вот для того, чтобы пользоваться одним архиватором на все случаи жизни, нужен новый формат RAR6 - с дедупликацией.

Лучшие алгоритмы сжатия и дедупликации разрабатываются годами, долго и вдумчиво. Посмотрите на сроки разработки тех же Zstd или SREP. У меня нет возможности выделить столько времени на разработку очередного алгоритма. Это не то, что требуется массовому пользователю архиватора общего назначения типа WinRAR.
 
Пользователю нужны удобство и набор типовых функций, высокая скорость распаковки, приемлемая скорость упаковки, разумный расход памяти, чтобы можно было распаковать на мобильнике. Если раньше я писал, что с каждым годом важность степени сжатия для массового пользователя снижается, то, пожалуй, уже можно константировать, что этот процесс практически завершен. Если я в 6.0 единственным методом сжатия оставлю "Store", мне кажется, большинство пользователей на это уже не обратит внимания.
 
Например, в 5.90 алгоритм, используемый в -m1 (fastest), был ускорен на многоядерниках раза в полтора, и размер сжатого enwik9 -m1 изменился с 351 до 303 KB. Я не помню сколько-нибудь заметной реакции на этот счет. Тишина. При этом на тему смены иконок приходили десятки эмоциональных откликов.
 
Сейчас смена алгоритма скорее вызовет негативную реакцию из-за проблем с совместимостью. Чтобы это скомпенсировать, степень сжатия надо улучшить на большинстве типов данных хотя бы на треть, не потеряв в скорости. Процентов 10 - 15 сжатия мало кто заметит. А ситуация с набором однотипных iso все же редкая. В наши дни, если для скачивания, такие iso выложат упакованными по отдельности или вообще неупакованными. Если для стандартного бэкапа, так для iso скорее надо прописывать упаковку с нулевым сжатием ради скорости. Внутри iso обычно уже пожатые данные, и намного чаще типичный пользователь потеряет время на попытку их сжатия, чем что-то выиграет за счет поиска совпадений в других iso.
 
На мой взгляд, золотой век архиваторов в смысле сжатия данных остался далеко позади. Многим нынешним пользователям в качестве базового алгоритма хватило бы и tar, но с GUI, шифрованием, восстановлением данных, томами и прочими фичами. А такая ситуация серьезно демотивирует тратить годы на разработку нового алгоритма сжатия.

Всего записей: 2258 | Зарегистр. 29-04-2013 | Отправлено: 20:19 13-06-2020 | Исправлено: EugeneRoshal, 20:21 13-06-2020
Victor_VG



Tracker Mod
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
EugeneRoshal
 
Tar (Tape Archiver, UNIX System 7 / Seven Edition UNIX, 1979 год) вообще ничего не сжимает а просто создаёт контейнер с точной копией фрагмента файловой системы от указанной точки, но он да, умеет вызывать внешние компрессоры, и было бы интересно воспользоваться комбинацией tar + rar = tar.rar, так чтобы tar завершив создание контейнера вызвал rar для его сжатия. Но, думаю это стоит перенести в разряд мысленных экспериментов т.к. потребует доработки tar и подбора свободной буквы для ключа команды, а там насколько я помню уже почти весь алфавит задействован. А потому это лишняя работа ради удовлетворения любопытства, не дело.
 
Добавлено:
А GUI для Tar давно есть, и есть WinTar ( WinTar is a C# based program to handle TAR and MTF (Microsoft Tape Format) formats. The GNU tar for Windows does not handle tape devices and does not handle the MTF format.) проект не развивается с 2008-го, tar for windows 1.15.1 (gnu tar port in windows visual studio project version 1.15.1) от 2005-го года. Ну и ещё могу при случае вспомнить, но у всех что-то да не реализовано или иные последствия спешки авторов.

----------
Жив курилка! (Р. Ролан, "Кола Брюньон")
Xeon E5 2697v2/C602/128 GB PC3-14900L/GTX 1660 Ti, Xeon E5-2697v2/C602J/128 Gb PC3-14900L/GTX 1660 Ti

Всего записей: 33217 | Зарегистр. 31-07-2002 | Отправлено: 20:42 13-06-2020
persicum

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
EugeneRoshal,
 
Вы правы в том, что большинство контента сегодня поставляется в сжатом виде, который дальше почти не сжимается. Но тогда дедупликация является единственным шансом его серьезно сжать, если повезет)
 
по поводу blake2s, по моим замерам он работает в WinRAR быстрее чем crc32, и менять его на что-то другое совершенно бессмысленно. Да и то, чтобы оценить, нужно запускать из RAM, иначе чтение с физического диска всё испортит.
 
А сколько потоков в реализации blake2s? Специально не мониторил, но показалось не больше 4-х.

Всего записей: 462 | Зарегистр. 27-06-2007 | Отправлено: 21:06 13-06-2020
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
EugeneRoshal
А ведь используя "Save identical files as references." можно создать некое подобие zip-bomb в плане нехватки места на диске
 
Victor_VG

Цитата:
и подбора свободной буквы для ключа команды, а там насколько я помню уже почти весь алфавит задействован.

с zstd это ведь как-то решили, только какой в этом смысл?

Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 21:58 13-06-2020 | Исправлено: los, 21:58 13-06-2020
EugeneRoshal

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
persicum

Цитата:
А сколько потоков в реализации blake2s? Специально не мониторил, но показалось не больше 4-х.

В RAR используется восьмипоточный BLAKE2sp, плюс SIMD (SSE2) обработка данных в каждом потоке.
 
Практической необходимости в BLAKE3 в RAR действительно нет, так как BLAKE2sp уже достаточно быстр. Просто в BLAKE3 реализовали то, что мне хотелось увидеть в хэш-функции еще на этапе разработки RAR5 - использование произвольного количества потоков. Я тогда подумывал сам сделать многопоточный хэш на основе какого-нибудь существующего однопоточного, но потом предпочел готовый вариант от специалистов в криптографии. Все-таки это не моя область, да и хотелось использовать сколько-нибудь стандартный хэш.
 
Поэтому к BLAKE3 я все равно присматривался, так как интерес к быстрому криптографическому хэшу с компактным кодом и произвольным количеством потоков остался еще со времен RAR5. Но пока отложил его в сторону. "Компактный" это не про BLAKE3, у него слишком объемный код. Если сравнить базовые портируемые C исходники без SIMD, получается где-то 53 KB BLAKE3 против 11 KB BLAKE2sp. Даже если в BLAKE3 кое-что можно сократить (я особо не вникал), все равно размер явно вырос в разы. А 50 KB для исходников хэш функции в архиваторе это, на мой взгляд, перебор.
 
Были бы в BLAKE3 примерно те же 11 кб исходников, я бы задумался по его поводу. Не факт, что использовал бы, но рассматривал бы более пристально.
 
 
Добавлено:
los

Цитата:
А ведь используя "Save identical files as references." можно создать некое подобие zip-bomb в плане нехватки места на диске

Мне кажется, в этом плане есть столько вариантов, что еще один погоды не делает. Чем лучше пакует архиватор, тем более он пригоден для этой цели. У bzip2, например, совершенно выдающаяся степень сжатия при упаковке файла из одного повторяющегося символа.
 
В случае RAR тоже можно просто нули упаковать, пусть и не так эффективно как bz2 или "Save identical files as references".
 
В автоматических системах, которые уязвимы к такого рода атакам, надо как-то ограничивать доступное для распаковщика место на диске. Тот же архив bz2 с нулями все проверки на корректность структуры перед распаковкой пройдет, архив как архив.
 
Добавлено:
los

Цитата:
А ведь используя "Save identical files as references." можно создать некое подобие zip-bomb в плане нехватки места на диске  

Как, кстати, и любой алгоритм дедупликации и, даже, отчасти, RAR solid

Всего записей: 2258 | Зарегистр. 29-04-2013 | Отправлено: 22:22 13-06-2020 | Исправлено: EugeneRoshal, 22:38 13-06-2020
insorg



Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
EugeneRoshal
Раз пошёл такой разговор, то я не могу не спросить.
 
1.
В качестве эксперимента хотя бы, пока бета тест идёт... Некое подобие srep или аналог его, чтоб можно было хотя бы идентичные данные сокращать на дистанции больше размера словаря. Я понимаю трудности и вероятные костыли, но это очень офигенно было бы.
Пример, у меня почта ежегодно бэкапится в единый pst файл (да, у меня Outlook), весу около 10 гигов на файл, и я это жму максимально возможным словарём. Но только заморочка в том, что иногда и этого мало, чтоб найти повторения вложенных картинок в письмах или дублях документов во вложениях.  
Может, есть возможность как-то эффективно найти выход - то на % сжатия это очень хорошо даст прирост.
 
2.
Очень хочу словарь 2 и 4 ГБ для rar5 метода. Это осуществимо?

Всего записей: 16668 | Зарегистр. 04-11-2010 | Отправлено: 23:04 13-06-2020
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
EugeneRoshal

Цитата:
Мне кажется, в этом плане есть столько вариантов...

вы правы, но забыв про ключ '-oh' можно неплохо "пошутить"
P.S.
а xxHash в качестве алгоритма не рассматриваете? Считает достаточно шустро.

Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 23:22 13-06-2020
EugeneRoshal

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
insorg

Цитата:
Некое подобие srep или аналог его, чтоб можно было хотя бы идентичные данные сокращать на дистанции больше размера словаря.

Сейчас очередная смена алгоритма RAR не планируется. Я выше объяснил мотивы. Это сложная и объемная задача, к тому же, не особо востребованная массовым пользователем.

Цитата:
Очень хочу словарь 2 и 4 ГБ для rar5 метода. Это осуществимо?

Технически формат RAR5 это позволяет, но эта возможность не используется из-за последующих проблем с распаковкой в 32-битных ОС и на мобильных устройствах. Ударило бы по репутации формата.
 
los

Цитата:
а xxHash в качестве алгоритма не рассматриваете?

Я хотел именно криптографический хэш. Чтобы при совпадающих хэшах можно было быть уверенным, что и данные файлов совпадают.

Всего записей: 2258 | Зарегистр. 29-04-2013 | Отправлено: 23:38 13-06-2020
shpulkin

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
EugeneRoshal
 
Вы главное поддержку ВинХП не убирайте, ато я сейчас активно прокачиваю сборку ХП для нового железа - https://www.modlabs.net/forum/topic/60346/ и ваш архиватор должен работать, я им пользуюсь.

Всего записей: 52 | Зарегистр. 05-06-2020 | Отправлено: 00:01 14-06-2020
ItsJustMe

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
EugeneRoshal
Согласен с вашими словами, что "золотой век архиваторов" прошел. Сейчас у пользователей нет необходимости жать всё, что попадется под руку, как это было раньше - во времена, когда деревья были большие, а HDD маленькие и интернет по модему.
 
Но в одном вы, предположу, всё же ошибаетесь. ( Хотя шутку юмора оценил.) Если оставить только Store, юзеры это всё же заметят. Ибо раз уж юзер задействовал архиватор, он всё же ожидает, что размер архива будет меньше, чем размер упаковываемой папки. Даже если всё это хранится на 20 TB диске. Сразу возникнет вопрос: "А зачем нужен архиватор, который не жмет?"
 
Я немного не понял, а почему 53 KB исходников это проблема? Тем более, если в BLAKE3, как вы говорите, реализовали то, что вы сами хотели реализовать. Или интеграция BLAKE3 выходит сложнее, чем интеграция BLAKE2?
 
И насчет поддержки древних Windows, которые на 5 лет старше своих яростных адептов. Может, есть смысл собирать 2 версии WinRAR? Версию "WinRAR здорового человека", собранную в современной Visual Studio 2019, и версию "для яростных адептов", собранную в старье и напичканную костылями и проверками на наличие тех или иных WinAPI. А из "версии здорового человека" все эти костыли выкинуть.

Всего записей: 2028 | Зарегистр. 02-09-2005 | Отправлено: 01:32 14-06-2020
mig73



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Сейчас у пользователей нет необходимости жать всё, что попадется под руку, как это было раньше - во времена, когда деревья были большие

Вы сильно не правы. Есть необходимость и будет во все времена, когда деревья были большими это было просто обязательно.
 
EugeneRoshal
Я так же голосую за поддержку XP, а то понимаешь ли начали тут выпиливать, как то Inno Setup 6 блин и теперь он нахрен 6-ой никому не нужен стал.
 
p.s. Пусть уж лучше закроют нафиг поддержку x32, которая уже давно всем мешает. Перешли же с 16-bit на 32 и не развалились...

Всего записей: 8283 | Зарегистр. 24-02-2010 | Отправлено: 01:49 14-06-2020 | Исправлено: mig73, 01:56 14-06-2020
Pasha_ZZZ



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Конечно, данные сейчас обычно уже пожаты. Но в основном это ZLIB и ему подобные. Поэтому и существует PRECOMP. А для длинных данных - SREP.
Но это все игрушки для тех, кто хочет ими играть, а для массового пользователя - ненужности.
Тем более, кто уж очень хочет - может какой-нибудь FAZIP использовать, к нему эти штуки прикрутятся.

Всего записей: 12398 | Зарегистр. 11-03-2002 | Отправлено: 05:59 14-06-2020
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

Компьютерный форум Ru.Board » Компьютеры » Программы » WinRAR (часть 3)
Maz (27-08-2020 19:31): WinRAR (часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru