Здравствуйте! Подскажите, пожалуйста, теории и алгоритмы разбора(анализа) данных в таблице.
Потому как сходу разобрать regex'ом таблицы, составленные людьми и для людей не получается. Да, в каждой таблице обязательно есть нужные мне поля с данными, но они представлены разными ключевыми словами и иногда в таблице присутствует многоуровневая структура с подзаголовками. Сейчас добавил к regex'у многоуровневые заголовки, качество разбора стало на порядок выше. Но все равно много ошибочно полученных полей.
Наверняка много кто уже сталкивался с подобного рода задачами, направьте в нужную сторону, чтобы я не изобрел велосипед случайно
Спасибо!