EN|RU

Том 14, серия 2, номер 2, 2007 г., Стр. 3–13

УДК 519.722
М. П. Бакулина
Использование закона Ципфа для сжатия текстов

Аннотация:
Рассматривается одна из важных задач теории информации – задача сжатия данных, в частности, текстов на естественных языках, с сохранением возможности их однозначного восстановления (декодирования). Предлагается один из способов решения этой задачи – построение кодов, базирующихся на законе Ципфа. В отличие от универсальных методов такое построение использует знания о статистической структуре источника сообщений. Рассматриваются алгоритмы двухпроходной и однопроходной схем кодирования и оценивается эффективность их сжатия.
Библ. 15.

Бакулина М. П. 1
1. Институт вычислительной математики и математической геофизики СО РАН,
пр. aкадемика Лаврентьева, 6, 630090 Новосибирск, Россия
е-mail: marina@rav.sscc.ru

Статья поступила 17 мая 2007 г.
Исправленный вариант — 29 октября 2007 г.

 © Институт математики им. С. Л. Соболева, 2015