У меня за много лет накопилось на сотни мегабайт почтовых баз (в формате The Bat!). Там почти исключительно небольшие текстовые сообщения, львиную долю объема которых составляют почтовые заголовки (описание путей доставки, отчеты антивирусов и прочая левая хрень). Удалив все это, можно и базу сжать в несколько раз, и во столько же раз ускорить поиск по ней.
Нетрудно написать на коленке приблуду, которая обработает экспорт в формате Unix Mailbox, а затем импортировать обратно, но опасаюсь допустить какую-нибудь мелкую ошибку в анализе/обработке формата, которая испортит отдельные письма или их части, а я этого заметить не сумею.
Может, уже есть ли что-нибудь готовое для удаления из почтовых заголовков всего, кроме From/To/Subject/Date?