Здравствуйте, sun2013, Вы писали:
S>Здравствуйте!
S>Есть файл с таким примерно содержимым:
S>ID,Text
S>0||text0
S>1||text1
S>2||text2
S>Соответственно, вопрос — как распарсить? Хотелось бы, наверное, получить DataFrame pandas с двумя колонками в итоге (если возможно). Буду благодарен за помощь.
https://docs.python.org/2/library/csv.html... << RSDN@Home 1.0.0 alpha 5 rev. 0>>
Здравствуйте, sun2013, Вы писали:
S>Здравствуйте!
S>Есть файл с таким примерно содержимым:
S>ID,Text
S>0||text0
S>1||text1
S>2||text2
S>Соответственно, вопрос — как распарсить? Хотелось бы, наверное, получить DataFrame pandas с двумя колонками в итоге (если возможно). Буду благодарен за помощь.
df = pandas.read_csv('myfile.txt', delimiter='\|\|', engine='python', skiprows=1, header=None)
df.columns = ['ID', 'Text']
1. Т.к. разделитель "||" имеет длину два символа (а не один, как обычно), пришлось указать
engine=python
2. Т.к. разделитель названий столбцов отличается от разделителя строк, то пришлось вообще отключить парсинг названий (skiprows=1, header=None). А затем прописать названия явно.