"Колоночные" БД
От: Курилка Россия http://kirya.narod.ru/
Дата: 07.09.07 06:35
Оценка:
Хотелось бы обсудить опубливанную на слэшдоте идею о том, что вскоре значительную долю рынка БД должны отвоевать "колоночные" (если, конечно, это правильный перевод column database) БД, тогда как сейчас основной вариант — БД, ориентированные на строки. Безусловно ссылка на статью приведённая там (на слэшдоте) от заинтересованного лица (автор — товарищ, работающий в компании производящей подобную "колоночную" БД Vertica), но в качестве другого аргумента можно привести гугловский Bigtable, который тоже создан на подобном принципе.
Re: "Колоночные" БД
От: DrDred Россия http://kpavn.wordpress.com/
Дата: 07.09.07 07:23
Оценка:
Здравствуйте, Курилка, Вы писали:

К>Хотелось бы обсудить опубливанную на слэшдоте идею о том, что вскоре значительную долю рынка БД должны отвоевать "колоночные" (если, конечно, это правильный перевод column database) БД, тогда как сейчас основной вариант — БД, ориентированные на строки. Безусловно ссылка на статью приведённая там (на слэшдоте) от заинтересованного лица (автор — товарищ, работающий в компании производящей подобную "колоночную" БД Vertica), но в качестве другого аргумента можно привести гугловский Bigtable, который тоже создан на подобном принципе.


А что тут собственного говоря философского-то? Меняется технология хранения данных, но реляционная теория собственно говоря как была, так и остается, никуда не денется. Идет время, меняются технологии, эволюционный процесс, все как обычно. Для задач хранилищ данных, похоже действительно column-based подход более эффективен. Sybase IQ сервер, если мне память не изменяет, давно использует такой подход.
--
WBR, Alexander
skype: kpavn_
Re[2]: "Колоночные" БД
От: Курилка Россия http://kirya.narod.ru/
Дата: 07.09.07 07:36
Оценка:
Здравствуйте, DrDred, Вы писали:

DD>А что тут собственного говоря философского-то? Меняется технология хранения данных, но реляционная теория собственно говоря как была, так и остается, никуда не денется. Идет время, меняются технологии, эволюционный процесс, все как обычно. Для задач хранилищ данных, похоже действительно column-based подход более эффективен. Sybase IQ сервер, если мне память не изменяет, давно использует такой подход.


Теория-то останется, только вот как говорится в другой, там упоминаемой, статье Computerworld:

Relational database pioneer says technology is obsolete

Хотя на сайте той же Vertica написано:

...we have invented a brand-new column-oriented RDBMS architecture that provides blinding ad-hoc query performance for data marts and data warehouses.

Однако тот же Bigtable по сути есть лишь хранилище без навешанной на него реляционной логики, т.е. оперирование идёт над записями, получаемыми поиском по ключу.
Re[3]: "Колоночные" БД
От: DrDred Россия http://kpavn.wordpress.com/
Дата: 07.09.07 08:54
Оценка: +2
Здравствуйте, Курилка, Вы писали:

К>Теория-то останется, только вот как говорится в другой, там упоминаемой, статье Computerworld:

К>

К>Relational database pioneer says technology is obsolete

К>Хотя на сайте той же Vertica написано:
К>

К>...we have invented a brand-new column-oriented RDBMS architecture that provides blinding ad-hoc query performance for data marts and data warehouses.

К>Однако тот же Bigtable по сути есть лишь хранилище без навешанной на него реляционной логики, т.е. оперирование идёт над записями, получаемыми поиском по ключу.

Припадаем к первоисточнику (я так понимаю ссылка на эту статью?)
Вот оригинал, читаем

But Stonebraker now argues that relational databases, also known as RDBMSes, are "long in the tooth" and "should be considered legacy technology."

Читаем статью дальше, там гораздо более вменяемый текст, из которого видно, что и column-based идея не нова, и row-based имеет свои преимущества для OLTP-систем, и основное преимущество Vertica в архивации данных на лету и поиске по этим архивированным данным... И в комментариях видим абсолютно справедливое замечание, что реляционная теория не накладывает никаких ограничений на архитектуру хранения данных, ведь мы по-прежнему оперируем отношениями, так какая разница, как это хранится? Так что имхо тут больше шума и пиара, чем реальной новизны...

Да, и еще... Выделенное, особенно про "навешанную реляционную логику" можешь более подробно расшифровать?
--
WBR, Alexander
skype: kpavn_
Re: "Колоночные" БД
От: Quintanar Россия  
Дата: 07.09.07 09:30
Оценка:
Здравствуйте, Курилка, Вы писали:

К>Хотелось бы обсудить опубливанную на слэшдоте идею о том, что вскоре значительную долю рынка БД должны отвоевать "колоночные" (если, конечно, это правильный перевод column database) БД, тогда как сейчас основной вариант — БД, ориентированные на строки. Безусловно ссылка на статью приведённая там (на слэшдоте) от заинтересованного лица (автор — товарищ, работающий в компании производящей подобную "колоночную" БД Vertica), но в качестве другого аргумента можно привести гугловский Bigtable, который тоже создан на подобном принципе.


Что тут обсуждать-то? Такие БД давно есть и на своих задачах они рвут conventional DBs как тузик грелку. Это не значит, что они везде и всегда хороши. Так же как нельзя однозначно сказать, что императивный язык лучше функционального или наоборот. В разных задачах, разная полезность.
Re[3]: "Колоночные" БД
От: Трурль  
Дата: 07.09.07 09:56
Оценка:
Здравствуйте, Курилка, Вы писали:

К>

К>...we have invented a brand-new column-oriented RDBMS architecture that provides blinding ad-hoc query performance for data marts and data warehouses.

В обсуждавшейся здесь kdb точно такая же brand-new architecture.
Re[2]: "Колоночные" БД
От: pongo  
Дата: 09.09.07 10:51
Оценка:
Здравствуйте, Quintanar, Вы писали:
Q>Что тут обсуждать-то? Такие БД давно есть и на своих задачах они рвут conventional DBs как тузик грелку. Это не значит, что они везде и всегда хороши. Так же как нельзя однозначно сказать, что императивный язык лучше функционального или наоборот. В разных задачах, разная полезность.

Но что-то про бд такого типа совсем ничего не слышно. Мне вот, например, интересно сравнение производительности схожего высоконагрузочного приложения на row-based бд и column-based. Все-таки мне представляется, что column-based значительно быстрее. (Или какие тогда задачи у подобных бд?)
Re: "Колоночные" БД
От: Sinclair Россия http://corp.ingrammicro.com/Solutions/Cloud.aspx
Дата: 10.09.07 04:50
Оценка: +2
Здравствуйте, Курилка, Вы писали:

К>Хотелось бы обсудить опубливанную на слэшдоте идею о том, что вскоре значительную долю рынка БД должны отвоевать "колоночные" (если, конечно, это правильный перевод column database) БД, тогда как сейчас основной вариант — БД, ориентированные на строки. Безусловно ссылка на статью приведённая там (на слэшдоте) от заинтересованного лица (автор — товарищ, работающий в компании производящей подобную "колоночную" БД Vertica), но в качестве другого аргумента можно привести гугловский Bigtable, который тоже создан на подобном принципе.

Голимый пеар. Ничего принципиально нового в этой технологии нету.
Во-первых, никаких специальных изменений реляционной алгебры тут не видать. Стало быть, о "замене" RDBMS говорить не приходится.
Во-вторых, такое представление данных известно испокон веков; фактически, это доведенное до абсурда секционирование таблиц. DBA этим занимаются на профессиональной основе; современная коммерческая СУБД позволяет разрезать таблицу на N таблиц по числу неключевых колонок, и даже построить view, которое даст возможность приложениям манипулировать этим конгломератом 100% прозрачно.
Конечно же, Vertica на некоторых запросах будет летать шустрее, благодаря использованию компрессора и более эффективному представлению ключей. Но фишка в том, что RDBMS могут применять все те же методы у себя внутри. Там вообще уже применяется большое количество трюков, каждый из которых не менее революционный, чем "поворот мышления на 90 градусов". Вот уж точно: банальный наклон головы — и это выдается за могучий пируэт? Это техническая подробность, интересный прием. По уму, место ему — в обсуждениях среди разработчиков СУБД, рядом с различными структурами индексов и стратегиями кластеризации данных.

Куда как более революционными являются, к примеру, поддержка spatial queries или построение индексов по XML данным для оптимизации XQuery — запросов.
... << RSDN@Home 1.2.0 alpha rev. 677>>
Уйдемте отсюда, Румата! У вас слишком богатые погреба.
http://rsdn.org/File/5743/rsdnaddict.GIF
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.