Re[5]: Закат GPU?
От: gear nuke  
Дата: 05.08.09 13:03
Оценка:
Здравствуйте, Lorenzo_LAMAS, Вы писали:

L_L>Пару месяцев назад окончательно R.I.P. вроде как.


А когда начинали, обещали к выпуску подходящего железа Не буду делать из этого каких-то выводов, просто ради факта — Manhattan Project зачем то релизился, хотя в планах вроде как и не было
.
People who are more than casually interested in computers should have at least some idea of what the underlying hardware is like. Otherwise the programs they write will be pretty weird (c) D.Knuth
Re[11]: а как же Larrabee?
От: Erop Россия  
Дата: 10.08.09 17:05
Оценка:
Здравствуйте, CreatorCray, Вы писали:

CC>Уточни пожалуйста, чтож это за проект такой, который состоит из одного файла исходников в метр толщиной.

Ну какой-нибудь генерённый код. Скажем у тебя есть какие-то данные, которые описывают структуру чего-то, а они компилируются в код, который эту структуру к чему-то как-то применяет...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[2]: а как же Larrabee?
От: Erop Россия  
Дата: 10.08.09 17:06
Оценка:
Здравствуйте, CreatorCray, Вы писали:

M>>а как же Larrabee?

CC>Он же вроде как еще не вышел.
CC>Выйдет — посмотрим.

В частности на пенальти, когда разные ядра лезут в одну и ту же память...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[5]: Закат GPU?
От: Erop Россия  
Дата: 10.08.09 17:27
Оценка:
Здравствуйте, Кэр, Вы писали:

Кэр>Смотря кому. Intel в плане разработки процессоров впереди планеты всей. Да возможно NVidia чтобы сделать когерентный кэш придется потратить очень хорошие деньги и ресурсы. И тратить потом хорошие деньги на каждую копию. Intel возможно сможет это делать гораздо дешевле.

Да это не важно. Просто так или иначе этой куче процов нужно будет как-то разделять шину данных, как-то поддерживать когерентным кэш и т. д. Так что, скорее всего, алгоритмы будут всё равно сильно очень ограниченны по паттернам доступа к ОЗУ. Так что не ясно будет ли большой бонус от "всеядности" процессоров. А вот пенальти будут значительные. Ясно что, CUDFовских ядер можно насажать за те же деньги намного больше...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[9]: Закат GPU?
От: Erop Россия  
Дата: 10.08.09 17:31
Оценка: -1
Здравствуйте, Кэр, Вы писали:

Кэр>Так CUDA — на самом деле это и есть большой шаг в сторону CPU на самом деле. Сейчас там много ограничений — subset of C — это на самом деле грустно. С++ выглядит здесь гораздо более внушительно.


То, что в CUDA такой убогий язык -- это всего лишь проблемы SDK, а не архитектуры. По существу CUDA не позволяет использовать указатели на функции (ну и виртуальные методы соответственно). Всё остальное С++ в принципе доступно, просто у них компилятор всё ещё убогий, но к аппаратной архитектуре это всё никакого отношения не имеет...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[12]: Закат GPU?
От: Erop Россия  
Дата: 10.08.09 17:34
Оценка:
Здравствуйте, thesz, Вы писали:

T>x86 в контексте Лараби СКОРЕЕ ВСЕГО означает очень низкую производительность.
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[13]: Закат GPU?
От: thesz Россия http://thesz.livejournal.com
Дата: 11.08.09 09:05
Оценка:
Здравствуйте, Erop, Вы писали:

E>Здравствуйте, thesz, Вы писали:


T>>x86 в контексте Лараби СКОРЕЕ ВСЕГО означает очень низкую производительность.


Что сие означает?
Yours truly, Serguey Zefirov (thesz NA mail TOCHKA ru)
Re[14]: Закат GPU?
От: Erop Россия  
Дата: 11.08.09 09:28
Оценка:
Здравствуйте, thesz, Вы писали:

T>>>x86 в контексте Лараби СКОРЕЕ ВСЕГО означает очень низкую производительность.

T>Что сие означает?

ЧТо кто его знает, какое оно будет? Или они уже зарелизили, а я просто не в курсе?
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[13]: Закат GPU?
От: thesz Россия http://thesz.livejournal.com
Дата: 11.08.09 09:32
Оценка:
Здравствуйте, Erop, Вы писали:

E>Здравствуйте, thesz, Вы писали:


T>>x86 в контексте Лараби СКОРЕЕ ВСЕГО означает очень низкую производительность.


Уж коли встал, надо продолжить.

СКОРЕЕ ВСЕГО означает ОЧЕНЬ высокую вероятность.

Практически все команды x86 переводятся в несколько команд RISC стиля.

Если мы будем выполнять эти команды без требовательного к ресурсам чипа out-of-order, то у нас получится медленное выполнение, поскольку команды зависят одна от другой (add [ebx],eax раскладывается на MIPS-style load temp,[ebx]; add temp2,temp,eax; store temp2,[ebx], то же самое и для сопроцессора). OOO требует достаточно большой ассоциативной памяти, на всякий случай.

Мы можем выполнять примитивные команды в стиле Sun Niagara, это снизит ощущаемую процессором задержку выполнения, но это всё равно означает низкую производительность одного потока — вместо 1GHz получится исполнение на 500, 250 или 125MHz.

Поэтому на x86 не обойтись без OOO для получения высокой однопоточной производительности.

А где OOO, там меньше ядер. Один декодер x87 в RISC чего стоит — он занимает чуть ли не половину площади кристалла, отпущенную под процессор, судя по фотографиям. Тогда, как просто 64-бит FPU без регистров должен занимать на 0.13u всего порядка 0.5кв.мм.
Yours truly, Serguey Zefirov (thesz NA mail TOCHKA ru)
Re[15]: Закат GPU?
От: thesz Россия http://thesz.livejournal.com
Дата: 11.08.09 09:32
Оценка:
Здравствуйте, Erop, Вы писали:

E>Здравствуйте, thesz, Вы писали:


T>>>>x86 в контексте Лараби СКОРЕЕ ВСЕГО означает очень низкую производительность.

T>>Что сие означает?

E>ЧТо кто его знает, какое оно будет? Или они уже зарелизили, а я просто не в курсе?


Это следует из обычных несложных прикидок.
Yours truly, Serguey Zefirov (thesz NA mail TOCHKA ru)
Re[16]: Закат GPU?
От: Erop Россия  
Дата: 11.08.09 09:34
Оценка: +1
Здравствуйте, thesz, Вы писали:

T>>>>>x86 в контексте Лараби СКОРЕЕ ВСЕГО означает очень низкую производительность.

T>>>Что сие означает?
E>>ЧТо кто его знает, какое оно будет? Или они уже зарелизили, а я просто не в курсе?
T>Это следует из обычных несложных прикидок.

Из обычных прикидок, тем более несложных, может следовать только в модальности "скорее всего"...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[17]: Закат GPU?
От: thesz Россия http://thesz.livejournal.com
Дата: 11.08.09 10:07
Оценка:
Здравствуйте, Erop, Вы писали:

E>Здравствуйте, thesz, Вы писали:


T>>>>>>x86 в контексте Лараби СКОРЕЕ ВСЕГО означает очень низкую производительность.

T>>>>Что сие означает?
E>>>ЧТо кто его знает, какое оно будет? Или они уже зарелизили, а я просто не в курсе?
T>>Это следует из обычных несложных прикидок.

E>Из обычных прикидок, тем более несложных, может следовать только в модальности "скорее всего"...


По соображениям, изложенным рядом, тебе сказать нечего?
Yours truly, Serguey Zefirov (thesz NA mail TOCHKA ru)
Re[10]: Закат GPU?
От: CreatorCray  
Дата: 11.08.09 12:07
Оценка:
Здравствуйте, Erop, Вы писали:

E>То, что в CUDA такой убогий язык -- это всего лишь проблемы SDK, а не архитектуры. По существу CUDA не позволяет использовать указатели на функции (ну и виртуальные методы соответственно). Всё остальное С++ в принципе доступно, просто у них компилятор всё ещё убогий, но к аппаратной архитектуре это всё никакого отношения не имеет...

Еще как имеет. Железо затачивалось под игровые цели, и эти заточки вытарчивают даже в тесле.
... << RSDN@Home 1.1.4 stable SR1 rev. 568>>
Re[18]: Закат GPU?
От: Erop Россия  
Дата: 11.08.09 12:44
Оценка:
Здравствуйте, thesz, Вы писали:

T>По соображениям, изложенным рядом, тебе сказать нечего?

Ну в Интел же не дураки сидят? Зачем-то же они за этот проект взялись? Наверное есть какие-то ходы неочевидные...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[11]: Закат GPU?
От: Erop Россия  
Дата: 11.08.09 12:46
Оценка:
Здравствуйте, CreatorCray, Вы писали:

CC>Еще как имеет. Железо затачивалось под игровые цели, и эти заточки вытарчивают даже в тесле.

Ну и что из С++, кроме указателей на функции нельзя сделать на КУДЕ аппаратно? Кое-что будет медленно (если ветвиться программа будет много и по разному в разных ядрах), но чтобы совсем нельзя, вроде бы нет ничего...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[19]: Закат GPU?
От: thesz Россия http://thesz.livejournal.com
Дата: 11.08.09 14:55
Оценка:
Здравствуйте, Erop, Вы писали:

E>Здравствуйте, thesz, Вы писали:


T>>По соображениям, изложенным рядом, тебе сказать нечего?

E>Ну в Интел же не дураки сидят? Зачем-то же они за этот проект взялись? Наверное есть какие-то ходы неочевидные...

GPU не проводит анализа. Он работает только на обработке. Larabee же типичный GPU, x86 там стоит только в качестве маркетингового хода и, получается из анализа, бесполезен.

А на обработке более широкая шина (8*single float SIMD)может многое дать.

Хотя я всё равно сомневаюсь насчёт пользы широкой шины.

Большая часть операций в GPU трехмерные и ещё много скалярных. Поэтому на предыдущем поколении стояли 2xSIMD, что позволяло лучше утилизировать площадь: скалярная операция занимала всего 2 слота SIMD вместо 4 на SSE. На другие 2 можно было что-то запихнуть в параллель со скалярной операцией (SSE не даёт использовать оставшиеся три пути, если работаешь со скаляром в регистре).

Насчёт "не дураков в Интеле" напомню про проблемы длинного конвейера в P4.
Yours truly, Serguey Zefirov (thesz NA mail TOCHKA ru)
Re[12]: Закат GPU?
От: CreatorCray  
Дата: 12.08.09 13:39
Оценка:
Здравствуйте, Erop, Вы писали:

CC>>Еще как имеет. Железо затачивалось под игровые цели, и эти заточки вытарчивают даже в тесле.

E>Ну и что из С++, кроме указателей на функции нельзя сделать на КУДЕ аппаратно? Кое-что будет медленно (если ветвиться программа будет много и по разному в разных ядрах), но чтобы совсем нельзя, вроде бы нет ничего...
Например там нельзя никак сделать полноценную рекурсию, т.к. нету стека

железо ж изначально затачивалось под конкретные задачи растеризации графики.
... << RSDN@Home 1.1.4 stable SR1 rev. 568>>
Re[13]: Закат GPU?
От: Erop Россия  
Дата: 12.08.09 14:13
Оценка:
Здравствуйте, CreatorCray, Вы писали:

CC>Например там нельзя никак сделать полноценную рекурсию, т.к. нету стека

Ну и фиг с ней. Кому она нужна на тех задачах? Там вообще ветвиться сильно стрёмно...

CC>железо ж изначально затачивалось под конкретные задачи растеризации графики.

Ну там ограничения внеязыковой характер носят. Скорее некоторые алгоритмы запрещены, чем какие-то С++ конструкции...

Короче, убогость КУДАшного языка -- это именно убогость языка. То, что железо имеет некоторые ограничения -- это плата за то, что оно дешёвое, и при этом может таки обеспечить массовую параллельность. А убогость SDK -- это просто так, убогость SDK без всякого доп. смысла...
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Re[14]: Закат GPU?
От: CreatorCray  
Дата: 12.08.09 14:42
Оценка:
Здравствуйте, Erop, Вы писали:

CC>>Например там нельзя никак сделать полноценную рекурсию, т.к. нету стека

E>Ну и фиг с ней. Кому она нужна на тех задачах? Там вообще ветвиться сильно стрёмно...
Ну ну. И ты еще про какие то С++ фичи речь ведешь?

CC>>железо ж изначально затачивалось под конкретные задачи растеризации графики.

E>Ну там ограничения внеязыковой характер носят. Скорее некоторые алгоритмы запрещены, чем какие-то С++ конструкции...
Ты вообще с их железом сталкивался? Представление имеешь как именно оно устроено и работает?

E>Короче, убогость КУДАшного языка -- это именно убогость языка.

Убогость языка обусловлена возможностями железа.
А так под куду хоть на их асме пиши — вот уж где весь доступ к потенциалу железяки.
... << RSDN@Home 1.1.4 stable SR1 rev. 568>>
Re[15]: Закат GPU?
От: Erop Россия  
Дата: 12.08.09 15:42
Оценка:
Здравствуйте, CreatorCray, Вы писали:

CC>Ну ну. И ты еще про какие то С++ фичи речь ведешь?

А в чём проблемы? Запрет ветвиться -- это ограничение на алгоритм, а не на язык...

CC>Ты вообще с их железом сталкивался? Представление имеешь как именно оно устроено и работает?

Да, сталкивался и знаком. Правда в том SDK, с которым сталкивался я ещё не было и шаблонов. Просто какой-то кусок С своеобразный.
Но убогость того копмилятора ни с чем не была связана. Например никто не мешает иметь внутри КУДЫ класс вроде CComplex, скажем. Но убогое SDK не даёт.

E>>Короче, убогость КУДАшного языка -- это именно убогость языка.

CC>Убогость языка обусловлена возможностями железа.
CC>А так под куду хоть на их асме пиши — вот уж где весь доступ к потенциалу железяки.

Да ладно. Например в том SDK, с которым я имел дело, не знаю, модет с тех пор что-то пофиксили, нельзя было пользоваться строгой типизацией, например. При чём тут возможности железа?
Все эмоциональные формулировки не соотвествуют действительному положению вещей и приведены мной исключительно "ради красного словца". За корректными формулировками и неискажённым изложением идей, следует обращаться к их автором или воспользоваться поиском
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.