Из xml в html. Или как прочитать docx файл?
От: Аноним  
Дата: 22.10.10 18:56
Оценка:
Подскажите, как перевести из xml в html?
Собственно мне нужно прочитать docx файл. В docx файле ничего сложного нет, одни абзацы. Ну и "переводы на др. страницы".
Сам docx файл открыл, имею теперь xml документ. Как из него выбрать абзацы и оформить в html теги?

Ну к примеру вот в xml у меня есть

w:rsidR="00452796" w:rsidP="00FE31B3" w:rsidRDefault="00452796"><w:pPr><w:pStyle w:val="a3" /></w:pPr><w:r><w:t>Заголовок.</w:t></w:r></w:p><w:p

А мне бы сделать:

<p>Заголовок.</p>


Я тут нашёл одно решение
http://www.codeproject.com/KB/XML/XML_to_HTML_Convertor.aspx
но нужен некий xsl шаблон, но никак не понимаю как его сделать...
Может кто подскажет с ним? Там же всего 2 тега поставить.
Re: Из xml в html. Или как прочитать docx файл?
От: RushDevion Россия  
Дата: 22.10.10 19:18
Оценка:
По Вашей ссылке как раз этот самый XSL файл и есть, PersonnelHTML.xsl называется.
Вообще идея простая. Берем XML-файл, накладываем XSL-преобразование — на выходе имеем HTML.
В .NET это сделано через XSLCompiledTransform
По поводу XSLT/XPath — кратко ознакомиться можно здесь.
Re[2]: Из xml в html. Или как прочитать docx файл?
От: Аноним  
Дата: 22.10.10 19:29
Оценка:
Здравствуйте, RushDevion, Вы писали:

RD>По Вашей ссылке как раз этот самый XSL файл и есть, PersonnelHTML.xsl называется.

RD>Вообще идея простая. Берем XML-файл, накладываем XSL-преобразование — на выходе имеем HTML.
RD>В .NET это сделано через XSLCompiledTransform
RD>По поводу XSLT/XPath — кратко ознакомиться можно здесь.

Так проблема составить XSL файл.
Re[3]: Из xml в html. Или как прочитать docx файл?
От: RushDevion Россия  
Дата: 22.10.10 19:51
Оценка: +2
А>Так проблема составить XSL файл.

А вы попробовали? В чем КОНКРЕТНО проблема?
По второй моей ссылке — вся нужная информация.
Все как я люблю — кратко и по делу. Потратьте час-два на разбор — оно окупится потом.
А то складывается ощущение, что вы хотите, чтобы кто-то за вас это все сделал.
Пробуйте. Появятся конкретные вопросы — велкам. Да и файл исходный не помешало бы сюда выложить.
Re: Из xml в html. Или как прочитать docx файл?
От: Sinix  
Дата: 23.10.10 13:51
Оценка:
Здравствуйте, Аноним, Вы писали:

А>Подскажите, как перевести из xml в html?

А>Собственно мне нужно прочитать docx файл. В docx файле ничего сложного нет, одни абзацы. Ну и "переводы на др. страницы".

А если макросом сохранить как "html (с фильтром)"?

Теперь серьёзно.
Вроде то, что вам нужно: http://www.codeproject.com/KB/office/ExtractTextFromDOCXs.aspx

Если не подойдёт:

Коммерческое:
http://www.aspose.com/categories/.net-components/aspose.words-for-.net/default.aspx

Бесплатное:
0. http://msdn.microsoft.com/en-us/library/bb448854.aspx
1. http://sourceforge.net/projects/officeopenxml/

Ещё ссылок:
0. http://social.msdn.microsoft.com/forums/en-US/csharpgeneral/thread/d3b98370-7edb-4adb-bff0-6554a489b62a
1. http://conceptdev.blogspot.com/2007/03/open-docx-using-c-to-extract-text-for.html

Не проверял, ссылки из закладок и гугля.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.