Обнаружение заголовка табличных данных
От: TheBeginner  
Дата: 03.04.24 10:01
Оценка:
Допустим есть некие табличные данные. В этих данных может быть заголовок, может не быть заголовка, заголовок может быть из нескольких строк или даже заголовок может быть внутри таблицы, разделяя её на несколько таблиц.
Для эксперимента пронумеровал построчно несколько CSV файлов — ChatGPT вполне уверенно определяет заголовки и возвращает индексы строк заголовка.
Если локально эту задачу решать без ИИ, то самое простое что приходит в голову — некий словарь слов, которые могут использоваться в заголовке + базовые операции NLP вроде лемматизации. Понятно, что результат будет хуже. Нужен более сложный NLP.
Если какие ИИ модели для вот таких задач или более общих — отделения описания данных от самих данных?
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.