Читал недавно диссертацию на тему "Эффективные алгоритмы неискажающего сжатия текстовой информации" (Кадач А.В.)
стр.41:
Алгоритм ACB
В 1994 г. Г.Буяновский [1] предложил метод сжатия данных, названый им ACB (Associative Coding by Buyanovsky); им же был создан одноименный архиватор.
Статья [1] является самым невразумительным набором слов, который автору данной работы когда-либо удавалось встречать. Она состоит из трех страниц текста, описывающего алгоритм сжатия с помощью незнакомых автору терминов (воронка аналогий, стохастическая составляющая строки, вытяжка, жесткий информационный канал и т.д.) и заканчивается столь же малопонятным 7-страничным листингом программы, реализующей описанный алгоритм на смеси Си и Ассемблера с использованием жуткой смеси плохого русского и ломаного английского языков. К своему сожалению, автор признает, что ему не удалось понять принципов работы алгоритма ACB.
Как бы то ни было, алгоритм ACB действительно способен уменьшать объем кодируемых данных, причем качество сжатия сравнимо и часто лучше, чем у лучших вариантов алгоритмов сжатия семейства PPM. Скорость кодирования и декодирования алгоритма ACB чрезвычайно низкая (это один из самых медленных методов сжатия) при значительном объеме требуемой памяти.
Поскольку на практике алгоритм ACB является одни из лучших известных методов по качеству сжатия (см. главу 11 и [92]), автор счел необходимым упомянуть его.
...
[1] Буяновский Г. Ассоциативное кодирование // Монитор. — 1994. -N8. -С.10-19.
Здравствуйте, Кодт, Вы писали:
К>Очень похоже на прогрессивный алгоритм из семейства Лемпел-Зива, только не для чаров, а для отдельных битов. Да?
Папа, ты с кем сейчас разговаривал? (с) анекдот
К>>Очень похоже на прогрессивный алгоритм из семейства Лемпел-Зива, только не для чаров, а для отдельных битов. Да? ROP>Папа, ты с кем сейчас разговаривал? (с) анекдот
Через пару часов он тут приведет пару багов в реализации "агоритма на смеси Си и Ассемблера"
Российские учёные разработали революционный алгоритм, позволяющий сжимать до гигабайта информации в один бит и реализовали его в собственном архиваторе. Не смотря на успех, они не собираются останавливаться на достигнутом и в данный момент ведут разработку алгоритма дезархивации.
sc wrote:
> Здравствуйте, swined, Вы писали: > > .... >>> А разжать это можно? Первого, я еще понял. А вот тебя... какой алгоритм? >>> > > S>разжать можно, но есть неопределенности — КоРоВа vs КРоВь, например > > Придется анализировать контекст. Типа, если пасется на лугу или дает > молока, то скорее всего корова.
вс бл злт крв
вася был залит кровью
всё белое злит корову
Здравствуйте, R.O. Prokopiev, Вы писали: ROP>Иио иио иио аы о ROP>и оа оа и ок ии ы (с) КВН(?)
По-моему, «Городок».
P. S. Кто не понял:
Миллион, миллион, миллион алых роз из окна, из окна, из окна видишь ты.
Pavel Dvorkin wrote:
> Здравствуйте, Рома Мик, Вы писали: > > РМ>Кнчн. Мжн вкнть глсн нпрмр. > > Чт мт мст в зкх : врт рбск . > > Вы поняли, что я написал или нет ? Думаю, что нет. Расшифровываю > > Что имеет место в языках : иврит, арабский. > > Там это проходит, а в русском не очень. > > С нлчшм пжлнм.
около тысячи лет назад в русском (церковном в основном — кроме попов редко
кто умел писать делалось именно так.
sc wrote:
> Здравствуйте, swined, Вы писали: > > S>sc wrote: > >>> Здравствуйте, swined, Вы писали: >>> >>> .... >>>>> А разжать это можно? Первого, я еще понял. А вот тебя... какой >>>>> алгоритм? >>>>> >>> >>> S>разжать можно, но есть неопределенности — КоРоВа vs КРоВь, например >>> >>> Придется анализировать контекст. Типа, если пасется на лугу или дает >>> молока, то скорее всего корова. > > S>вс бл злт крв > S>вася был залит кровью > S>всё белое злит корову > > S>какой из вариантов правильный? > > второй, так как в слове кровью есть Ь (явно не глассная), которого нет в > исходной фразе
shit, облажался. но идея думаю понятна
при желании (хоть и достаточно большом) можно придумать два довольно длинных
связных текста не имеющих ничего общего, но при этом кодирующихся
одинаково. это вам не в мд5 коллизии искать
S>около тысячи лет назад в русском (церковном в основном — кроме попов редко S>кто умел писать делалось именно так.
Щас начну придератся к словам, не бейте меня сильна.
Тыщу лет тому назад, в россии небыло письменности, максимум "причерноморские знаки"
в 800 году кнам из византии пришли два балгара Кирил и Мефодий, эти люди адаптировали латинский алфовит к русскому языку, добавили несоклько фонем, и радовались жизнью. Попы тогда не изменяли, проста они по привычке глаголицей писали, а эта письменность была адский сложная
Здравствуйте, Юрий Жмеренецкий, Вы писали:
ЮЖ>Читал недавно диссертацию на тему "Эффективные алгоритмы неискажающего сжатия текстовой информации" (Кадач А.В.)
Интересно, а что, текстовую информацию можно сжимать искажающи?
Здравствуйте, prVovik, Вы писали: V>Интересно, а что, текстовую информацию можно сжимать искажающи?
Например, обфускация исходников: длинный_мнемонический_идентификатор -> a1
Правда тут обратная операция обычно не выполняется... Хотя нет, при сжатии теряется столько информации, что "разжатие" не имеет смысла.
Да просто можно комментарии выкинуть
Здравствуйте, Кодт, Вы писали:
К>Здравствуйте, R.O. Prokopiev, Вы писали:
ROP>>О! У меня этот номер "Монитора" где-то в кладовке хранится. К>Выложи в формате дежавю хотя бы...
Всё уже отсканировано до нас.
Вот первая ссылка, выданная гуглем http://www.compression.ru/download/cm.html#ac_r
Спасибо!
А я что-то не особо вкурил даже в либретто. Очень похоже на прогрессивный алгоритм из семейства Лемпел-Зива, только не для чаров, а для отдельных битов. Да?
Здравствуйте, Рома Мик, Вы писали:
РМ>Здравствуйте, prVovik, Вы писали:
V>>Интересно, а что, текстовую информацию можно сжимать искажающи? РМ>Кнчн. Мжн вкнть глсн нпрмр.
у-у
Здравствуйте, prVovik, Вы писали:
V>Здравствуйте, Юрий Жмеренецкий, Вы писали:
ЮЖ>>Читал недавно диссертацию на тему "Эффективные алгоритмы неискажающего сжатия текстовой информации" (Кадач А.В.)
V>Интересно, а что, текстовую информацию можно сжимать искажающи?
Dmirty-- wrote:
> Здравствуйте, R.O. Prokopiev, Вы писали: > > РМ>>Кнчн. Мжн вкнть глсн нпрмр. > ROP>у-у > > А разжать это можно? Первого, я еще понял. А вот тебя... какой алгоритм? >
разжать можно, но есть неопределенности — КоРоВа vs КРоВь, например
.... >> А разжать это можно? Первого, я еще понял. А вот тебя... какой алгоритм? >>
S>разжать можно, но есть неопределенности — КоРоВа vs КРоВь, например
Придется анализировать контекст. Типа, если пасется на лугу или дает молока, то скорее всего корова.
Здравствуйте, swined, Вы писали:
S>sc wrote:
>> Здравствуйте, swined, Вы писали: >> >> .... >>>> А разжать это можно? Первого, я еще понял. А вот тебя... какой алгоритм? >>>> >> >> S>разжать можно, но есть неопределенности — КоРоВа vs КРоВь, например >> >> Придется анализировать контекст. Типа, если пасется на лугу или дает >> молока, то скорее всего корова.
S>вс бл злт крв S>вася был залит кровью S>всё белое злит корову
S>какой из вариантов правильный?
второй, так как в слове кровью есть Ь (явно не глассная), которого нет в исходной фразе
Здравствуйте, Dmirty--, Вы писали:
D>Здравствуйте, R.O. Prokopiev, Вы писали:
РМ>>>Кнчн. Мжн вкнть глсн нпрмр. ROP>>у-у D>А разжать это можно? Первого, я еще понял. А вот тебя... какой алгоритм?
у-у = угу
Сжатие выкидыванием согласных.
Здравствуйте, swined, Вы писали:
S>sc wrote:
>> Здравствуйте, swined, Вы писали: >> >> S>sc wrote: >> >>>> Здравствуйте, swined, Вы писали: >>>> >>>> .... >>>>>> А разжать это можно? Первого, я еще понял. А вот тебя... какой >>>>>> алгоритм? >>>>>> >>>> >>>> S>разжать можно, но есть неопределенности — КоРоВа vs КРоВь, например >>>> >>>> Придется анализировать контекст. Типа, если пасется на лугу или дает >>>> молока, то скорее всего корова. >> >> S>вс бл злт крв >> S>вася был залит кровью >> S>всё белое злит корову >> >> S>какой из вариантов правильный? >> >> второй, так как в слове кровью есть Ь (явно не глассная), которого нет в >> исходной фразе
S>shit, облажался. но идея думаю понятна S>при желании (хоть и достаточно большом) можно придумать два довольно длинных S>связных текста не имеющих ничего общего, но при этом кодирующихся S>одинаково. это вам не в мд5 коллизии искать
тогда можно будет добавить контекст, избыточную информацию, главное не переборщить
sc wrote:
> Здравствуйте, swined, Вы писали: > > S>sc wrote: > >>> Здравствуйте, swined, Вы писали: >>> >>> S>sc wrote: >>> >>>>> Здравствуйте, swined, Вы писали: >>>>> >>>>> .... >>>>>>> А разжать это можно? Первого, я еще понял. А вот тебя... какой >>>>>>> алгоритм? >>>>>>> >>>>> >>>>> S>разжать можно, но есть неопределенности — КоРоВа vs КРоВь, например >>>>> >>>>> >>>>> Придется анализировать контекст. Типа, если пасется на лугу или дает >>>>> молока, то скорее всего корова. >>> >>> S>вс бл злт крв >>> S>вася был залит кровью >>> S>всё белое злит корову >>> >>> S>какой из вариантов правильный? >>> >>> второй, так как в слове кровью есть Ь (явно не глассная), которого нет в >>> исходной фразе > > S>shit, облажался. но идея думаю понятна > S>при желании (хоть и достаточно большом) можно придумать два довольно > длинных S>связных текста не имеющих ничего общего, но при этом > кодирующихся S>одинаково. это вам не в мд5 коллизии искать > > тогда можно будет добавить контекст, избыточную информацию, главное не > переборщить
избыточная информация — гласные. но какие из них убрать, а какие добавить?
заранее неизвестен полный список "пересечений", т.к. словаря то нету
полного а был бы — можно было бы кодировать гораздо проще
Здравствуйте, prVovik, Вы писали:
V>Здравствуйте, Юрий Жмеренецкий, Вы писали:
ЮЖ>>Читал недавно диссертацию на тему "Эффективные алгоритмы неискажающего сжатия текстовой информации" (Кадач А.В.)
V>Интересно, а что, текстовую информацию можно сжимать искажающи?
Да ладно. Можно даже exe-шники сжимать с потерей качества. (Поздняка помнишь?)
UNIX way — это когда тебе вместо туалетной бумаги дают топор, рубанок и карту близлежащего леса
Здравствуйте, Юрий Жмеренецкий, Вы писали:
ЮЖ> Статья [1] является самым невразумительным набором слов, который автору данной работы когда-либо удавалось встречать. Она состоит из трех страниц текста, описывающего алгоритм сжатия с помощью незнакомых автору терминов (воронка аналогий, стохастическая составляющая строки, вытяжка, жесткий информационный канал и т.д.) [/q] ЮЖ>(с) Кадач А.В. 1997
Сапур.
Жесткий информационный канал. Помогает настроить свое восприятие на постоянное получение космической информации. Выводит на информационные слои Вселенной, на общение с Силами.
Здравствуйте, Йожыгофф, Вы писали:
Й>Щас начну придератся к словам, не бейте меня сильна. Й>Тыщу лет тому назад, в россии небыло письменности, максимум "причерноморские знаки" Й>в 800 году кнам из византии пришли два балгара Кирил и Мефодий,