Алгоритм разбора (парсинга) таблицы данных, анализ таблицы и
От: alexmk85  
Дата: 07.12.10 12:59
Оценка:
Здравствуйте! Подскажите, пожалуйста, теории и алгоритмы разбора(анализа) данных в таблице.
Потому как сходу разобрать regex'ом таблицы, составленные людьми и для людей не получается. Да, в каждой таблице обязательно есть нужные мне поля с данными, но они представлены разными ключевыми словами и иногда в таблице присутствует многоуровневая структура с подзаголовками. Сейчас добавил к regex'у многоуровневые заголовки, качество разбора стало на порядок выше. Но все равно много ошибочно полученных полей.

Наверняка много кто уже сталкивался с подобного рода задачами, направьте в нужную сторону, чтобы я не изобрел велосипед случайно

Спасибо!
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.