Re[3]: Не "массовый" проект
От: gibo  
Дата: 13.07.04 20:52
Оценка:
Здравствуйте, Dmitry Ulitin, Вы писали:

...
G>>Другое дело что OLAP клиент в таком виде действительно никому не нужен.
G>>OLAP позволяет эффективно решать аналитические задачи в областях где имеется очень большой объем данных. Настолько большой, что средства SQL работают слишком медленно. Язык MDX, который используется для запросов к OLAP серверу, взаимно однозначно отображается на SQL, поэтому с точки зрения функциональности OLAP ничего не добавляет. Просто все работает быстрее и запросы имеют слегка более понятный и близкий к предметной области синтаксис. Для кубов даже есть специальный режим, при котором MDX запросы просто транслируются в SQL и выполняются обычным образом.

DU>Это на базе данных детского сада? И сколько запросов успеют послать пользователи, прежде чем помрёт сервер?

DU>(не спорю — "режим" есть)

Вроде я об этом и написал. Собственно текст выше говорит о том что OLAP работает быстрее для своего класса задач, в том и есть его основное преимущество.

G>>Дальше, по поводу впаривания. Аналитики нуждаются в максимально понятных, мощных и как можно менее ресурсоемких инструментах анализа данных. Анализ данных или data mining это обширная область науки.

G>>...
DU>Даже странно, что многие аналитики об этом не знают И продолжают использовать OLAP вместо ROLAP, MDX вместо SQL, PivotTable в качестве основного инструмента просмотра многомерных данных, а Data Mining и сложные вычисляемые меры поручают серверу.

Нигде не упоминалось что ROLAP это лучший режим. См. комментарий выше.
Основная мысль не в том, что OLAP это плохо, а в том что без дополнительного инструментария его полезность низковата. Действительно, можно просматривать данные, запросы будут выполняться быстро. А что дальше то, как искать полезную информацию в этих просматриваемых данных? Для этого и применяются те дополнительные средства анализа о которых я писал. Производительность OLAP сервера позволяет выполнять сложные алгоритмы с приемлемой скоростью. И тут проявляется коммерческая полезность клиентских продуктов — они позволяют эффективно решать аналитические задачи:
— искать взаимосвязи данных, делать предсказания на основе собранной информации
— оценивать результаты анализа в числовом выражении, например в виде вероятностных коэффициентов
— выводить результаты различными способами

PivotTable сам по себе не позволяет эффективно решать эти задачи. Как только речь заходит о чем то большем, чем просто посмотреть на данные, выясняется что нужна более тяжелая артиллерия.
Ну вот пример, чтоб хоть как то уйти от абстрактных рассуждений
Есть результаты тестирования оборудования с длинным вектором изменяемых характеристик по критерию производительность. Надо найти совокупность характеристик, которые наиболее сильно влияют на производительность, и их оптимальные значения. Кроме того надо оценить вероятность ошибки в числовом выражении.
С одной пивоттаблой с этой задачкой можно справиться только если данных очень мало и можно посчитать все вручную. То есть посмотреть на результаты запросов по всей совокупности перестановок характеристик и посмотреть как меняется производительность. В случае большого количества характеристик и возможных значений сложность растет по экспоненте, т.к. алгоритм поиска в общем случае комбинаторный.
Классификационные алгоритмы решают подобные задачи без проблем. Просто им скармливаются начальные данные где искать и что искать. На выходе имеем результат например в виде правил или в виде дерева принятия решений с соответствующими вероятностями. Чтобы обработать данные алгоритм генерирует большое количество запросов, от которых любой SQL сервер сразу загибается. А OLAP справляется без проблем. Для этого он и предназначен.

G>>Действительно полезное и востребованное приложение в этой области, отвечающее современным требованиям, сделать можно. Но сколько сотен человеко — лет для этого потребуется сказать сложно Потому мое мнение такое, что вам стоит либо оставить эту область, либо поискать работу в крупной компании которая занимается такими задачами.

DU>Очень распространенное мнение — сделать сложно, поэтому нечего и пытаться.

Пытаться можно и нужно. Но только желательно сначала оценить объем требуемых ресурсов. Я думаю выше достаточно ясно показано что усилий нужно приложить гораздо больше, чем требуется для создания пивоттаблы и графика. Ну не решаются реальные задачи вот так запросто.

DU>Тем не менее, спасибо за совет!


Велкам! Взгляните на существующие реализации OLAP клиентов, на те задачи которые требуется решать, на партнеров и клиентов компаний которые этим занимаются. Может то что выше станет более очевидным. http://polyvista.com например.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.