Здравствуйте, bayonet1971, Вы писали:
>>PostScript для печати, SQL для СУБД… Нужна ли схема по которой это делать. >>И как уже было сказано, его намного проще индексировать. B>Что значит индексировать XML-файл ?
Представь что у тебя есть готовая html-библиотека, при чём сделаная левыми руками. То есть все заголовки, абзацы, цитаты, заголовки оформлены например таким образом:
<div class="vazhnyj_zagolovok">Книга «Интернет для самоваров»</div>
<div class="prosto_zagolovok">Глава 1</div>
<div class="citata">Да будет так!</div>
<div class="tekst">
Тыры-пыры, это текст главы. Трам-пам-пам…
А <span class="vydelenyj">вот это</span> важный текст.
</div>
Пусть у тебя будет классная css-таблица, и смотреться это всё будет просто без подобно, но роботу, который будет индексировать эти твои книги будет одинаково всё равно, где у тебя заголовок, а где текст. Следовательно, он не сможет составить список, например, всех названий книг. Тут у тебя применено просто графическое форматирование.
А вот если бы ты сделал такую xml-структуру:
<book genre="IT" subgenre="networks">
<info>
<title>Интернет для самоваров</title>
<author>Вася Пяточкин</author>
<year>2222</year>
</info>
<content>
<header paragraph="1">Вступление</header>
<article>
Тыры-пыры, это текст главы. Трам-пам-пам…
А <important>вот это</important> важный текст.
</article>
</content>
</book>
(я немногго приукрасил пример, что бы показать полезность xml)
то роботу нужно было бы найти только header-элементы. Улавливаешь мысль?
Эта структура описывает логическое представление документа.
Так вот поиск, анализ, систематизация, упорядочивание, присваивание приоритетов — это и есть индексирование.
Ну и этот xml ты уже можешь привести к требуемому виду, как я уже писал.
P. S. Этот пример книги можно правильно описать и на html при помощи элементов p, h1, blockquote, em.
Объясните, плиз, как можно использовать XML для создания web-страничек ?
Я вот на RSDN часто вижу xml в расширениях файлов страничек, а какой в этом
смысл не понимаю.
Тока ни надо говорить как с маленьким — я сам дипломную по XML/XSLT делал,
но там же типа программирование, а тут типа статьи, чисто типа текст с
рисунками. Не проще ли его сразу в HTML написать ?
B>Не проще ли его сразу в HTML написать ?
>А если потребуется радикальное изменение дизайна? CSS не предлагать.
Так и что ?
Почему бы не CSS ?
ИМХО, XSL труднее переписать.
>Помимо прочего, на rsdn статьи хранятся в хмл формате и конвертируются >потом для статей в журнале и >для показа на сайте из одного источника
А-а-а, так может это не помимо, а как раз потому что ?
Здравствуйте, bayonet1971, Вы писали:
B>>Не проще ли его сразу в HTML написать ?
>>А если потребуется радикальное изменение дизайна? CSS не предлагать. B>Так и что ? B>Почему бы не CSS ? B>ИМХО, XSL труднее переписать.
>>Помимо прочего, на rsdn статьи хранятся в хмл формате и конвертируются >>потом для статей в журнале и >>для показа на сайте из одного источника B>А-а-а, так может это не помимо, а как раз потому что ?
А еще:
+индексация: чистый xml отдельно индексировать лучше, чем html с наворотами
+автоматизация: Некоторые вещи а именно — нумерация заголовков, списков делаются автоматически. В html попробует ли кто?
Кроме печатного варианта этот же источник можно использовать для "многостраничной" версии отображения статей. При этом, все линки внутри документа описываются формально.
Здравствуйте, bayonet1971, Вы писали:
B>Объясните, плиз, как можно использовать XML для создания web-страничек ? B>Я вот на RSDN часто вижу xml в расширениях файлов страничек, а какой в этом B>смысл не понимаю. B>Тока ни надо говорить как с маленьким — я сам дипломную по XML/XSLT делал, B>но там же типа программирование, а тут типа статьи, чисто типа текст с B>рисунками. Не проще ли его сразу в HTML написать ?
Вопрос зачем пишется страница. Вообще, конечно, глупо использовать связку XML/XSLT для простеньких статичных страничек, которые используются только для одного web-сайта. Если хочется сделать "правильно", так на это есть XHTML... (в кавычках, поскольку понятие спорное и скользкое).
Контент используется на разных страницах и в web-приложениях, с фильтрацией каких-то элементов содержимого и т.д., то конечно лучший вариант это XML+XSLT.
Здравствуйте, bayonet1971, Вы писали:
B>Объясните, плиз, как можно использовать XML для создания web-страничек ? B>Я вот на RSDN часто вижу xml в расширениях файлов страничек, а какой в этом B>смысл не понимаю. B>Тока ни надо говорить как с маленьким — я сам дипломную по XML/XSLT делал, B>но там же типа программирование, а тут типа статьи, чисто типа текст с B>рисунками. Не проще ли его сразу в HTML написать ?
Дело в том, что XML задаёт структуру документа (а правила структуры ты можешь сам сочинять как тебе угодно и удобно). А далее XML-документ можно преоброзовать во всё что угодно: HTML для веба, PostScript для печати, SQL для СУБД… Нужна ли схема по которой это делать.
И как уже было сказано, его намного проще индексировать.
>Дело в том, что XML задаёт структуру документа (а правила структуры ты >можешь сам сочинять как тебе >угодно и удобно). А далее XML-документ можно преоброзовать во всё что >угодно: HTML для веба, >PostScript для печати, SQL для СУБД… Нужна ли схема по которой это делать. >И как уже было сказано, его намного проще индексировать.
Что значит индексировать XML-файл ?
>>А если потребуется радикальное изменение дизайна? CSS не предлагать. B>Так и что ? B>Почему бы не CSS ? B>ИМХО, XSL труднее переписать.
При радикальной смене дизайна CSS можно забодаться переписывать. Вдобавок, нужно убить энное количество времени на то, чтобы корректно составить изначальный HTML-документ так, чтобы он позволял извращения с CSS. Например, csszengarden.com при всей его крутости абсолютно не переносится на сколько-нибудь серьезное содержимое (кстати, у них самих извращения в дизайне происходят только над главной страницей).
А почему? Потому что в HTML'e нет четкого разделения на данные и представление данных.
В отличие от HTML'я, связка XML + XSL(T) позволяет хранить данные и их представление отдельно друг от друга и с представлением извращаться, как хочешь. В CSS невозможно из div'a сделать table или span, а в XML:
data.xml
<my_element>
<data>
some data
</data>
</my_element>
>>Помимо прочего, на rsdn статьи хранятся в хмл формате и конвертируются >>потом для статей в журнале и >>для показа на сайте из одного источника B>А-а-а, так может это не помимо, а как раз потому что ?
В случае rsdn, скорее всего "потому что" , так как я не думаю, что перед авторами стоял вопрос о радикальной смене дизайна. А вот различное представление из одного и того же источника — да (хотя это те же яйца, только в профиль)
Здравствуйте, bayonet1971, Вы писали:
>>Дело в том, что XML задаёт структуру документа (а правила структуры ты >>можешь сам сочинять как тебе >>угодно и удобно). А далее XML-документ можно преоброзовать во всё что >>угодно: HTML для веба, >>PostScript для печати, SQL для СУБД… Нужна ли схема по которой это делать. >>И как уже было сказано, его намного проще индексировать. B>Что значит индексировать XML-файл ?
В простых словах — подготовить документ для системы поиска.
Когда документ не структуирован, то возможности поиска в нем достаточно проблематичны. Разумеется, на классической странице могут использоваться определенные тэги h1 и т.п. для выделения заголовков и других элементов документа. Но не факт. Обычно мы получаем нечто монструозное с обилием таблиц верстки и div+span как элемент украшательства.
В xml все элементы четко формализированы. Автор, дата, название...
В результате, мы можем осуществлять поиск именно в рамках этого элемента и нигде больше.
Индексация, как и в БД средство ускорение данного процесса.
Зы: Я сам дилетант и интуит в таких вопросах, так что излагать научно не могу. Извините, если в чем-то оказался не прав.
Здравствуйте, bayonet1971, Вы писали:
B>А можно с РСДН вытянуть xml-ку для изучения?
Не знаю $)
Скорее всего нет. Сервер настроен так (знающих прошу меня подправить), что при запросе xml-документа наружу он автоматом конвертируеться в html.
Спроси у кого-то из модераторов, админов etc.
b> А можно с РСДН вытянуть xml-ку для изучения? >Добавь в конце любого урла статей ?source.
Вытянул
Но че-то я там не увидел где xsl подключается ...
А XSL-ку вытянуть можно ?
B>Вытянул B>Но че-то я там не увидел где xsl подключается ... B>А XSL-ку вытянуть можно ? >А XSL-re можно уже самому наваять, глядя одним глазом в уже готовый HTML >статьи
ну а все-таки ?
Мне просто из любопытства, поэтому самому ваять неохота, да и некогда.
b>> А можно с РСДН вытянуть xml-ку для изучения?
DI>Добавь в конце любого урла статей ?source.
>Хм... А какие еще есть у сайта недокументированные особенности?
А что, есть документированные ?
>>Хм... А какие еще есть у сайта недокументированные особенности? B>А что, есть документированные ?
Ну, документированные — это те, до которых можно по ссылкам на сайте попасть. А есть, например, возможность просмотреть те же статьи в фомате PDF Правда, я уже не помню, как