Новая эра личных баз знаний - Образование и наука

Здравствуйте, Nuzhny, Вы писали:

N>Ты не указал самые интересные способы хранения знаний.
N>1. Mind map!

Указал, читай раздел "Карта разума". Те, которые основаны на базах данных, такие как Compendium_ со временем становятся слишком тормознутыми. Отчасти это происходит благодаря Java, отчасти из-за плохой оптимизации. Что касается FreeMind, MindMapper и других, то минус в разбиении на большое количество файлов, да и Dia превосходит их на голову не имея ненужных ограничений.

N>2. Теги. Поэтому можно разработать систему тегов и ориентироваться по ним (в том числе по ним).

Можно, да, у меня в планах давно уже такая программа. Но тут надо разрабатывать, а в html ничто не мешает использовать теги сразу за счёт якорей и гиперссылок.

N>3. Аудио. Многие просто начитывают мысли в диктофон, записи каталогизируют, систематизируют, иногда расшифровывают.

Я даже стримы вёл, это дохлый вариант. Слишком много лишнего, не подходит для личной базы знаний, которая должна напротив сжимать по максимуму информацию для её быстрейшего восстановления в мозгу.

N>4. Автоматическая суммаризация, кластеризация, построение связей. Вполне можно будет автоматически парсить заметки/статьи/исходники, чтобы находить связи между ними.

Это тоже одна из моих ошибок. Да, можно парсить, как раз парсер, лексер, токенизатор, я не раз рассказывал об этом. В чём ошибка, так всё просто, это мечта, что некая программа будет работать за тебя. Но нет, не будет, она может лишь помочь.

К тому же парсить будешь чужой мусор, а личная база знаний это считай совершенное личное ядро знаний. Совершенное оно не потому, что лучше нельзя, а потому что сам лучше до поры до времени не можешь.

Здесь самое главное, что я бы начал парсить сейчас, но нет нужного программного обеспечения. Чтобы его создать, нужно накопить знания в личной базе знаний. Попадаем в замкнутый круг.

Вот и выходит, что все способы были уже испробованы, из простых остался лишь ручной набор html.

Здравствуйте, velkin, Вы писали:

N>>1. Mind map!
V>Указал, читай раздел "Карта разума".

Указал, но толком ничего не сказал. Потому что это действительно очень удобное представление именно что знаний, а не просто способ поиска информации.
Извини, что твоя "статья" просто замусорена ненужными деталями, которые не про знания совсем — карандаши, линейки, тетради, диски, файлы. Это не относится к знаниям, а к способу хранения данных. Данные != знания.

N>>2. Теги. Поэтому можно разработать систему тегов и ориентироваться по ним (в том числе по ним).
V>Можно, да, у меня в планах давно уже такая программа. Но тут надо разрабатывать, а в html ничто не мешает использовать теги сразу за счёт якорей и гиперссылок.

Это тоже мимо — путаешь способ связывания и способ представления. Теги — это то же самоё, что и рёбра в графе, которые позволяют связывать между собой разные темы, статьи, произведения.

N>>3. Аудио. Многие просто начитывают мысли в диктофон, записи каталогизируют, систематизируют, иногда расшифровывают.
V>Я даже стримы вёл, это дохлый вариант. Слишком много лишнего, не подходит для личной базы знаний, которая должна напротив сжимать по максимуму информацию для её быстрейшего восстановления в мозгу.

Стримы или нет — не важно. Что ты делал, чтобы аудио данные превращались в структурированные данные, по которым можно переходить, каталогизировать, искать?

N>>4. Автоматическая суммаризация, кластеризация, построение связей. Вполне можно будет автоматически парсить заметки/статьи/исходники, чтобы находить связи между ними.
V>Это тоже одна из моих ошибок. Да, можно парсить, как раз парсер, лексер, токенизатор, я не раз рассказывал об этом. В чём ошибка, так всё просто, это мечта, что некая программа будет работать за тебя. Но нет, не будет, она может лишь помочь.
V>К тому же парсить будешь чужой мусор, а личная база знаний это считай совершенное личное ядро знаний. Совершенное оно не потому, что лучше нельзя, а потому что сам лучше до поры до времени не можешь.
V>Здесь самое главное, что я бы начал парсить сейчас, но нет нужного программного обеспечения. Чтобы его создать, нужно накопить знания в личной базе знаний. Попадаем в замкнутый круг.

Парсер, лексер и токенизатор — это не для естественных языков, они же не понимают контекст. Инструмент суммаризации обучается на огромном массиве внешних данных, а потом применяется уже для твоих: будь то записки или прочитанные статьи.

V>Вот и выходит, что все способы были уже испробованы, из простых остался лишь ручной набор html.

Или не испробованы.

Здравствуйте, Nuzhny, Вы писали:

V>>Вот и выходит, что все способы были уже испробованы, из простых остался лишь ручной набор html.
N>Или не испробованы.

Испробованы, а статья это итоговый вывод. Просто мне не хотелось ругать каждый способ, иначе бы статья увеличилась на порядок, а время её написания растянулось на несколько дней.

Борьба с нарастающей сложностью это то, что не дают ни карты разума, ни схемы, ни чертежи. ПИМы же просто сливаются от переизбытка информации и это вина их разработчиков, но имеем то, что имеем.

Как писал kov_serg.

Вы когда ходите вам нужна теория, прямохождения? Книги и лекции появились в результате эволюции. И если бы они были не эффективны их бы не использовали.
Изначально книги были не для обучения, а для передачи и накопления информации. Проблема в том что человек может лишь ограниченный объём данных ограниченное время, книги решили эту проблему.

По сути сайты тоже прошли процесс эволюции. Почему сейчас весь интернет в html, ведь распространять знания можно было бы в ином формате. А потому, что очевидно другие способы не сработали.

Так же и с форматом распространения знаний. Бывают более эффективные форматы и менее эффективные. Почему в том же описании технических деталей победил формат документации.

Если карты разума так круты, то почему мы не видим книги заполненные ими сверху донизу. Карты разума, схемы и чертежи могут стать составными элементами документации, но не основой.

Опять же эта моя точка зрения, если у кого есть способ лучше, то нет проблем. Я лишь объяснил почему для меня это не сработало.

Здравствуйте, velkin, Вы писали:

V>Если карты разума так круты, то почему мы не видим книги заполненные ими сверху донизу. Карты разума, схемы и чертежи могут стать составными элементами документации, но не основой.

Потому что в книги их не засунуть, для них необходимо хорошее специализированное ПО, оно платное. А также культура их ведения.

V>Опять же эта моя точка зрения, если у кого есть способ лучше, то нет проблем. Я лишь объяснил почему для меня это не сработало.

Для меня вообще странно звучит про html. Я также могу сказать: вся информация хранится в реляционных БД, а html генерируется автоматичски с требуемыми данными, полученными из этих БД. Но это опять же не знания, а данные и их представление. Про знания говорят в терминах онтологих, семантических связей, концептуальных схем. Вот mind map — это как раз про это.

Здравствуйте, Nuzhny, Вы писали:

N>Для меня вообще странно звучит про html. Я также могу сказать: вся информация хранится в реляционных БД, а html генерируется автоматически с требуемыми данными, полученными из этих БД.

Видишь ли, первый раздел статьи говорит о том, что знания хранятся и обрабатываются в первую очередь в мозгу, а всё остальное это лишь вспомогательные инструменты. Там даже есть условная картинка мозга и книги, чтобы было понятно отличие.

Возможно чтобы донести эту информацию для тех, кто над этим никогда не задумывался мне нужно написать книгу, где раз за разом мусолить одну и ту же мысль разными предложениями.

Как угодно калякай, хоть в тетради, хоть в html, хоть в базе данных, это прежде всего вспомогательный инструмент. Вопрос в том удобный ли или нет.

Думаешь разделить представление и данные это удобно. Но это лишь создаёт ненужную сложность, тормознутость, ограничение на структуры данных.

N>Про знания говорят в терминах онтологий, семантических связей, концептуальных схем. Вот mind map — это как раз про это.

Вот и попробуй записать код в картах разума. Я пробовал, получается плохо. Даже Dia не спасла, хотя она то как раз могла создавать гигантские схемы на одном листе.

Здравствуйте, velkin, Вы писали:

V>Видишь ли, первый раздел статьи говорит о том, что знания хранятся и обрабатываются в первую очередь в мозгу, а всё остальное это лишь вспомогательные инструменты. Там даже есть условная картинка мозга и книги, чтобы было понятно отличие.

Видишь ли, люди, занимающиеся компьютерным зрением, имеют представление о том, как и что хранится и обрабатывается в мозге. Хотя бы потому, что концепция свёрточных нейронных сетей была придумана под вдохновлением от книги "Глаз. Мозг. Зрение". И они её читают, а также многое другое. LSTM, attention, современные архитектуры Transformer и т.д. вдохновляются принципами, которые черпаются из знаний о мозге (это следует хотя бы из их названий).

V>Возможно чтобы донести эту информацию для тех, кто над этим никогда не задумывался мне нужно написать книгу, где раз за разом мусолить одну и ту же мысль разными предложениями.

Чтобы донести эту информацию, для начала надо разобраться в теме, потому что в вузах её всё таки преподают и вводят определённую терминологию. Но ты не пользуешься этой терминологией, присваиваешь известным терминам совсем другие значения и явно путаешь данные, с носителями данных и со знаниями.

V>Как угодно калякай, хоть в тетради, хоть в html, хоть в базе данных, это прежде всего вспомогательный инструмент. Вопрос в том удобный ли или нет.

Удобный для чего? html — это не средство хранения знаний, потому что у него нет никаких для этого инструментов. И тетрадь, и база данных. Это всё может использоваться для хранения и представления данных. А что со знаниями? Можно почитать, что ты пишешь:

V>Для этого не нужно никакого нового программного обеспечения. Те же таблицы MSOffice или LibreOffice позволяют упорядочить что угодно

Так их достаточно или нет?

V>Думаешь разделить представление и данные это удобно. Но это лишь создаёт ненужную сложность, тормознутость, ограничение на структуры данных.

И это при этом не имеет никакого отношения к знаниям. А что ты скажешь про современные архитектуры NLP сетей? Они же хранят в себе и данные, и связи между ними. Это уже базы знаний?

N>>Про знания говорят в терминах онтологий, семантических связей, концептуальных схем. Вот mind map — это как раз про это.
V>Вот и попробуй записать код в картах разума.

Зачем?!! Ты точно человек, а не нейросеть?

V>Я пробовал, получается плохо.

Не верю, что пробовал. Или покажи пример.

Здравствуйте, Nuzhny, Вы писали:

V>>Для этого не нужно никакого нового программного обеспечения. Те же таблицы MSOffice или LibreOffice позволяют упорядочить что угодно
N>Так их достаточно или нет?

К сожалению они как и ПИМы сливаются на действительно больших объёмах данных. Считай, что html это их скоростной аналог. Возможности форматирования гораздо выше, а скорость при объёмах не падает так катастрофично. То есть функционально их достаточно, а когда попробуешь создать огромный документ, тут и произойдёт лажа.

V>>Я пробовал, получается плохо.
N>Не верю, что пробовал. Или покажи пример.

Лень искать. Помню недавно ты с меня требовал статистику по заработку мобильных приложений, мне тоже было лень искать. Я тебе её в итоге показал, на что ты ответил в стиле, что всё это ерунда. Так и что напрягаться. Просто представь схему с десятками тысяч элементов.

Опять же смотри, а на чём ты сам пишешь код? Почему, к примеру, твой код это не какая-то заумная карта разума, или ещё что, а простой текст, коим так же является html. Ну и как-то яснее выражай свои мысли, а то непонятно, что пытаешься до меня донести. Который комментарий уже по сути ни о чём.

Здравствуйте, velkin, Вы писали:

V>То есть функционально их достаточно, а когда попробуешь создать огромный документ, тут и произойдёт лажа.

Так а зачем создавать огромный документ?
Вообще, я считаю, что для базы знаний одностраничных документов вполне достаточно.

Ведь что такое многостраничный документ? Это тупо одномерный список одностраничных документов, когда писателю лень создавать упорядоченную структуру с гиперссылками и он фигачит поток сознания.

Здравствуйте, graniar, Вы писали:

V>>То есть функционально их достаточно, а когда попробуешь создать огромный документ, тут и произойдёт лажа.
G>Так а зачем создавать огромный документ?

1) Чтобы работал поиск и замена по тексту.
2) Не нужно было переходить между файлами.
3) А ссылки перекидывали внутри документа.
4) Так же для повышения связности темы.

G>Вообще, я считаю, что для базы знаний одностраничных документов вполне достаточно.

А зачем книга сделана одной бумажной стопкой, можно же было сделать множество документов. Ещё и пронумерована и скреплена.

Представь, что заполняешь личную базу знаний и у тебя на некую тему вместо одного документа сто или тысяча. С одной стороны вроде бы хорошо, а с другой при каких-либо изменениях тебе придётся их все открывать и редактировать.

Например, ты решил убрать термины Master и Slave.
Из Python уберут служебные слова «master» и «slave» из-за политкорректности

Однако у тебя нет ни поиска, ни массовой замены по множеству документов. А даже если в каком-то редакторе и есть, то порой придётся всё равно проверять вручную, следовательно открыть кучу документов. И не проще тогда редактировать один документ, проводить его реструктуризацию, чем лазить по куче файлов.

В некоторых редакторах есть дерево файлов, то есть показывается файловая система и файлы открываются и сразу редактируются. Но что происходит со вкладками такого редактора. А на вкладках начинает возрастать список открытых файлов и вместо того, чтобы мотать ползунок или искать поиском приходится переключаться между вкладками.

Проблема множества документов ещё и в том, что количество не переходит в качество. Для получения качества приходится анализировать всю тему, а если она разбросана по множеству файлов, то желательно просмотреть их все для улучшения документов.

Каждый может делать так, как ему удобно или вообще не делать. Я вот не уверен, что у тех кто тут со мной общается есть личная база знаний, которая действительно занимает важную роль в жизни конкретного человека, а то и вообще есть.

У меня её нет, хотя я пытался создать много раз. Следующая попытка будет на html, так как теоретически это должно сработать. Потому что работало на многократно скопированных объёмах данных и не тормозило. А там видно будет что произойдёт на реальных данных.

Здравствуйте, velkin, Вы писали:

V>Лень искать. Помню недавно ты с меня требовал статистику по заработку мобильных приложений, мне тоже было лень искать. Я тебе её в итоге показал, на что ты ответил в стиле, что всё это ерунда. Так и что напрягаться. Просто представь схему с десятками тысяч элементов.

Ты мне показал среднюю температуру по больнице. Я говорил про вполне конкретный кейс приложений, а ты мне про игры

V>Опять же смотри, а на чём ты сам пишешь код? Почему, к примеру, твой код это не какая-то заумная карта разума, или ещё что, а простой текст, коим так же является html. Ну и как-то яснее выражай свои мысли, а то непонятно, что пытаешься до меня донести. Который комментарий уже по сути ни о чём.

Я конкретно и опять говорю, что ты по своему извращаешь общепринятые термины. Ты называешь знаниями и базой знаний не знания и не базу знаний. Mind map хоть приблизительно этому соответствует, твоя html поделка — нет.

Здравствуйте, Nuzhny, Вы писали:

N> Mind map хоть приблизительно этому соответствует, твоя html поделка — нет.

Тогда пользуйся картами разума, я тебе не запрещаю.

Здравствуйте, Nuzhny, Вы писали:

N>Я конкретно и опять говорю, что ты по своему извращаешь общепринятые термины. Ты называешь знаниями и базой знаний не знания и не базу знаний. Mind map хоть приблизительно этому соответствует, твоя html поделка — нет.

https://en.wikipedia.org/wiki/Personal_knowledge_base

«HTML-поделка» тоже этому соответствует; может даже больше, чем mind map.

Здравствуйте, velkin, Вы писали:

V>Я вот не уверен, что у тех кто тут со мной общается есть личная база знаний, которая действительно занимает важную роль в жизни конкретного человека, а то и вообще есть.

У меня есть, больше сотни файлов; да, занимает важную роль.

V>Пользователи того же GitHub очень радуются "Markdown" не подозревая, что на русский это переводится как "Разметка дауна".

МГИМО финишт?

V>Каждый может делать так, как ему удобно или вообще не делать.

Про даунов ты прям с козырей ворвался, а теперь: «как ему удобно».

V>1) Чтобы работал поиск и замена по тексту.

В VS Code или любом подобном редакторе с аутлайном и списком файлов (Sublime, IntelliJ) поиск и замена по всем файлам удобно и быстро работают.

V>2) Не нужно было переходить между файлами.

Переходить между файлами гораздо удобнее, чем скроллить по монолитному полотну.

V>4) Так же для повышения связности темы.

А «тема» — это не что-то фиксированное и замкнутое в себе, она пересекается со множеством других тем.
https://notes.andymatuschak.org/Evergreen_notes_should_be_atomic

V>А зачем книга сделана одной бумажной стопкой, можно же было сделать множество документов.

Так Луман в Цеттелькастене и делал множество карточек, индексировал их и настраивал перекрёстные ссылки.

V>Ещё и пронумерована и скреплена.

Во-первых, из логистических соображений, как ограничение носителя. В цифровом мире жёстких ограничений нет, целесообразность определяется иначе.
Во-вторых, книга — это не персональная база знаний (с целью кристаллизации знания), а публичная упаковка знаний (с целью передачи знания). Адресована не себе, а другим.

V>Однако у тебя нет ни поиска, ни массовой замены по множеству документов. А даже если в каком-то редакторе и есть

Почти в любом современном редакторе есть, обычно доступно по сочетанию Ctrl+Shift+F.

V>В некоторых редакторах есть дерево файлов, то есть показывается файловая система и файлы открываются и сразу редактируются. Но что происходит со вкладками такого редактора. А на вкладках начинает возрастать список открытых файлов и вместо того, чтобы мотать ползунок или искать поиском приходится переключаться между вкладками.

Так ненужные в текущий момент вкладки хотя бы можно закрыть. А простыня всегда распахнута.

V>Проблема множества документов ещё и в том, что количество не переходит в качество.

Именно что переходит, потому что выстраивается сеть связей между фрагментами (ссылки в Цеттелькастен — ключевое), в том числе связи между разными доменами.
А монолитный документ — это жёстко и негибко, внутри всё связано со всем; давать перекрёстные ссылки снаружи внутрь монолита — неудобно.

V>Для получения качества приходится анализировать всю тему

Обычно нет, нужно рассмотреть только релевантную информацию, и при необходимости походить по ссылкам или почитать индексную карточку.

V>а если она разбросана по множеству файлов, то желательно просмотреть их все для улучшения документов.

Википедия разбросана по множеству файлов. (И, заметь, никакой иерархии.) Смотреть все страницы при изучении какой-то темы необязательно (да и невозможно).

V>У меня её нет, хотя я пытался создать много раз. Следующая попытка будет на html, так как теоретически это должно сработать.

HTML как формат ввода, конечно, заметно хуже Маркдауна; но этот выбор сам по себе вряд ли станет решающей причиной неуспеха. А вот ориентация на таксономии (мир совершенно точно не устроен по иерархиям, как и знания о мире) и отказ от гранулярности в пользу монолитов — это уже режим провала.

Здравствуйте, velkin, Вы писали:

V>Личные знания людей прежде всего хранятся и обрабатываются в головах в нейронной сети во вполне физическом виде, назову это внутренним носителем. Но в большинстве случаев этого недостаточно и нужна дополнительная запись на внешние носители.

Любые знания имеют смысл лишь при их повторном использовании.
Знания часто устаревают, становятся неактуальными. В целом база знаний требует поддержки, затрат в том числе на систематизацию. В то же время потеря информации тоже имеет свою цену. Ты можешь спокойно не тратить время на сохранение какой-то информации, и это будет выгодно. Важно научиться отбрасывать ненужное. Поиск инфы — тоже затраты, если затраты на сохранение или каталогизацию выше чем потом при поиске — зачем они нужны?

К чему пришел я. В жизни у тебя есть проекты большие и маленькие, есть регулярные процессы. Знания же идут рука об руку с документами и вещами — это всё продукт минипроектов.

1. Два способа хранения инфы/доков — вещественный в виде коробок/папок и виртуальный в виде папок на яндекс.диске + почта — во втором случае инфа всегда с тобой.
2. Не надо вкладывать излишние усилия в стандартизацию, систематизацию и каталогизацию — достаточно осмысленно называть файлы и папки/коробки — потом найдешь нужное.

Появился некий кейс — например, возврат налогов, просто делаешь папку "возврат налогов 2019" — набрасываешь туда всё, что использовалось в ходе этого минипроекта — сканы доков, декларацию, список нужных документов. Делал ремонт в квартире — аналогично "квартира ленинский", если какие-то проекты были — бросаешь туда, фоткаешь схемы электрики сохраняешь "электрика", если проектов не было, но нужно помнить нюансы — просто создаешь текстовый файл и бросаешь в папку. Платишь регулярно за какие-то вещи? Делаешь файл "как платить.txt" — и набрасываешь там нюансы, которые надо иметь под рукой — номера счетов, логины/пароли (подсказки к оным) и т.п.
Делал технический проект для себя, какую-нибудь хреновину с автоматизацией? Заводишь под него папку — точно так же набрасываешь туда всё — сохраненные полезные страницы из интернета, свои мысли или заметки в текстовиках, проги если нужны были или код и т.д. — потом найдешь, разберешься, если потребуется, главное опиши финальное решение и кратко инструкцию по использованию, чтобы разобраться при перерыве в использовании, при поломках или доработках.
Всякие доки, запасные ключи и проч. по авто — коробка с именем "авто" — понадобится что-то, найдешь там быстро.
Инструкции храни рядом с используемым девайсом — к котлу на стене рядом с котлом, к кухонной технике — рядом с ней в шкафах или полочках, к снегоходу — на полке в сарае, где хранятся причиндалы для его обслуживания, всё по оружию (доки/патроны/чехлы) — в сейфе для оружия, и т.д.

В общем — обеспечь сохранение и облегчи поиск, когда понадобится — трать на это как можно меньше усилий, но не меньше.

>Личная база знаний одного человека может стать внешним источником знаний других людей, наглядный пример книги или статьи.
Книги и статьи как раз и пишутся так, чтобы могли быть источником для других — именно на это (на возможность использовать не только самому) тратится дополнительное время/усилия, порой довольно большие. Т.е. надо все-же различать — знания личные или для использования окружающими.

От:	velkin	http://blogs.rsdn.org/effective/
Дата:	17.01.22 11:57
Оценка:

От:	Nuzhny	https://github.com/Nuzhny007
Дата:	17.01.22 13:10
Оценка:

От:	velkin	http://blogs.rsdn.org/effective/
Дата:	17.01.22 13:41
Оценка:	-1

От:	Nuzhny	https://github.com/Nuzhny007
Дата:	17.01.22 13:54
Оценка:

От:	velkin	http://blogs.rsdn.org/effective/
Дата:	17.01.22 14:11
Оценка:	+1

От:	Qbit86	https://twitter.com/qbit86
Дата:	17.01.22 21:41
Оценка:

	От:	viellsky
	Дата:	18.01.22 12:13
	Оценка:

	От:	avovana
	Дата:	19.01.22 07:34
	Оценка: