Здравствуйте, Nuzhny, Вы писали:
N>Ты не указал самые интересные способы хранения знаний. N>1. Mind map!
Указал, читай раздел "Карта разума". Те, которые основаны на базах данных, такие как Compendium_ со временем становятся слишком тормознутыми. Отчасти это происходит благодаря Java, отчасти из-за плохой оптимизации. Что касается FreeMind, MindMapper и других, то минус в разбиении на большое количество файлов, да и Dia превосходит их на голову не имея ненужных ограничений.
N>2. Теги. Поэтому можно разработать систему тегов и ориентироваться по ним (в том числе по ним).
Можно, да, у меня в планах давно уже такая программа. Но тут надо разрабатывать, а в html ничто не мешает использовать теги сразу за счёт якорей и гиперссылок.
N>3. Аудио. Многие просто начитывают мысли в диктофон, записи каталогизируют, систематизируют, иногда расшифровывают.
Я даже стримы вёл, это дохлый вариант. Слишком много лишнего, не подходит для личной базы знаний, которая должна напротив сжимать по максимуму информацию для её быстрейшего восстановления в мозгу.
N>4. Автоматическая суммаризация, кластеризация, построение связей. Вполне можно будет автоматически парсить заметки/статьи/исходники, чтобы находить связи между ними.
Это тоже одна из моих ошибок. Да, можно парсить, как раз парсер, лексер, токенизатор, я не раз рассказывал об этом. В чём ошибка, так всё просто, это мечта, что некая программа будет работать за тебя. Но нет, не будет, она может лишь помочь.
К тому же парсить будешь чужой мусор, а личная база знаний это считай совершенное личное ядро знаний. Совершенное оно не потому, что лучше нельзя, а потому что сам лучше до поры до времени не можешь.
Здесь самое главное, что я бы начал парсить сейчас, но нет нужного программного обеспечения. Чтобы его создать, нужно накопить знания в личной базе знаний. Попадаем в замкнутый круг.
Вот и выходит, что все способы были уже испробованы, из простых остался лишь ручной набор html.
Здравствуйте, velkin, Вы писали:
N>>1. Mind map! V>Указал, читай раздел "Карта разума".
Указал, но толком ничего не сказал. Потому что это действительно очень удобное представление именно что знаний, а не просто способ поиска информации.
Извини, что твоя "статья" просто замусорена ненужными деталями, которые не про знания совсем — карандаши, линейки, тетради, диски, файлы. Это не относится к знаниям, а к способу хранения данных. Данные != знания.
N>>2. Теги. Поэтому можно разработать систему тегов и ориентироваться по ним (в том числе по ним). V>Можно, да, у меня в планах давно уже такая программа. Но тут надо разрабатывать, а в html ничто не мешает использовать теги сразу за счёт якорей и гиперссылок.
Это тоже мимо — путаешь способ связывания и способ представления. Теги — это то же самоё, что и рёбра в графе, которые позволяют связывать между собой разные темы, статьи, произведения.
N>>3. Аудио. Многие просто начитывают мысли в диктофон, записи каталогизируют, систематизируют, иногда расшифровывают. V>Я даже стримы вёл, это дохлый вариант. Слишком много лишнего, не подходит для личной базы знаний, которая должна напротив сжимать по максимуму информацию для её быстрейшего восстановления в мозгу.
Стримы или нет — не важно. Что ты делал, чтобы аудио данные превращались в структурированные данные, по которым можно переходить, каталогизировать, искать?
N>>4. Автоматическая суммаризация, кластеризация, построение связей. Вполне можно будет автоматически парсить заметки/статьи/исходники, чтобы находить связи между ними. V>Это тоже одна из моих ошибок. Да, можно парсить, как раз парсер, лексер, токенизатор, я не раз рассказывал об этом. В чём ошибка, так всё просто, это мечта, что некая программа будет работать за тебя. Но нет, не будет, она может лишь помочь. V>К тому же парсить будешь чужой мусор, а личная база знаний это считай совершенное личное ядро знаний. Совершенное оно не потому, что лучше нельзя, а потому что сам лучше до поры до времени не можешь. V>Здесь самое главное, что я бы начал парсить сейчас, но нет нужного программного обеспечения. Чтобы его создать, нужно накопить знания в личной базе знаний. Попадаем в замкнутый круг.
Парсер, лексер и токенизатор — это не для естественных языков, они же не понимают контекст. Инструмент суммаризации обучается на огромном массиве внешних данных, а потом применяется уже для твоих: будь то записки или прочитанные статьи.
V>Вот и выходит, что все способы были уже испробованы, из простых остался лишь ручной набор html.
Здравствуйте, Nuzhny, Вы писали:
V>>Вот и выходит, что все способы были уже испробованы, из простых остался лишь ручной набор html. N>Или не испробованы.
Испробованы, а статья это итоговый вывод. Просто мне не хотелось ругать каждый способ, иначе бы статья увеличилась на порядок, а время её написания растянулось на несколько дней.
Борьба с нарастающей сложностью это то, что не дают ни карты разума, ни схемы, ни чертежи. ПИМы же просто сливаются от переизбытка информации и это вина их разработчиков, но имеем то, что имеем.
Как писал kov_serg.
Вы когда ходите вам нужна теория, прямохождения? Книги и лекции появились в результате эволюции. И если бы они были не эффективны их бы не использовали.
Изначально книги были не для обучения, а для передачи и накопления информации. Проблема в том что человек может лишь ограниченный объём данных ограниченное время, книги решили эту проблему.
По сути сайты тоже прошли процесс эволюции. Почему сейчас весь интернет в html, ведь распространять знания можно было бы в ином формате. А потому, что очевидно другие способы не сработали.
Так же и с форматом распространения знаний. Бывают более эффективные форматы и менее эффективные. Почему в том же описании технических деталей победил формат документации.
Если карты разума так круты, то почему мы не видим книги заполненные ими сверху донизу. Карты разума, схемы и чертежи могут стать составными элементами документации, но не основой.
Опять же эта моя точка зрения, если у кого есть способ лучше, то нет проблем. Я лишь объяснил почему для меня это не сработало.
Здравствуйте, velkin, Вы писали:
V>Если карты разума так круты, то почему мы не видим книги заполненные ими сверху донизу. Карты разума, схемы и чертежи могут стать составными элементами документации, но не основой.
Потому что в книги их не засунуть, для них необходимо хорошее специализированное ПО, оно платное. А также культура их ведения.
V>Опять же эта моя точка зрения, если у кого есть способ лучше, то нет проблем. Я лишь объяснил почему для меня это не сработало.
Для меня вообще странно звучит про html. Я также могу сказать: вся информация хранится в реляционных БД, а html генерируется автоматичски с требуемыми данными, полученными из этих БД. Но это опять же не знания, а данные и их представление. Про знания говорят в терминах онтологих, семантических связей, концептуальных схем. Вот mind map — это как раз про это.
Здравствуйте, Nuzhny, Вы писали:
N>Для меня вообще странно звучит про html. Я также могу сказать: вся информация хранится в реляционных БД, а html генерируется автоматически с требуемыми данными, полученными из этих БД.
Видишь ли, первый раздел статьи говорит о том, что знания хранятся и обрабатываются в первую очередь в мозгу, а всё остальное это лишь вспомогательные инструменты. Там даже есть условная картинка мозга и книги, чтобы было понятно отличие.
Возможно чтобы донести эту информацию для тех, кто над этим никогда не задумывался мне нужно написать книгу, где раз за разом мусолить одну и ту же мысль разными предложениями.
Как угодно калякай, хоть в тетради, хоть в html, хоть в базе данных, это прежде всего вспомогательный инструмент. Вопрос в том удобный ли или нет.
Думаешь разделить представление и данные это удобно. Но это лишь создаёт ненужную сложность, тормознутость, ограничение на структуры данных.
N>Про знания говорят в терминах онтологий, семантических связей, концептуальных схем. Вот mind map — это как раз про это.
Вот и попробуй записать код в картах разума. Я пробовал, получается плохо. Даже Dia не спасла, хотя она то как раз могла создавать гигантские схемы на одном листе.
Здравствуйте, velkin, Вы писали:
V>Видишь ли, первый раздел статьи говорит о том, что знания хранятся и обрабатываются в первую очередь в мозгу, а всё остальное это лишь вспомогательные инструменты. Там даже есть условная картинка мозга и книги, чтобы было понятно отличие.
Видишь ли, люди, занимающиеся компьютерным зрением, имеют представление о том, как и что хранится и обрабатывается в мозге. Хотя бы потому, что концепция свёрточных нейронных сетей была придумана под вдохновлением от книги "Глаз. Мозг. Зрение". И они её читают, а также многое другое. LSTM, attention, современные архитектуры Transformer и т.д. вдохновляются принципами, которые черпаются из знаний о мозге (это следует хотя бы из их названий).
V>Возможно чтобы донести эту информацию для тех, кто над этим никогда не задумывался мне нужно написать книгу, где раз за разом мусолить одну и ту же мысль разными предложениями.
Чтобы донести эту информацию, для начала надо разобраться в теме, потому что в вузах её всё таки преподают и вводят определённую терминологию. Но ты не пользуешься этой терминологией, присваиваешь известным терминам совсем другие значения и явно путаешь данные, с носителями данных и со знаниями.
V>Как угодно калякай, хоть в тетради, хоть в html, хоть в базе данных, это прежде всего вспомогательный инструмент. Вопрос в том удобный ли или нет.
Удобный для чего? html — это не средство хранения знаний, потому что у него нет никаких для этого инструментов. И тетрадь, и база данных. Это всё может использоваться для хранения и представления данных. А что со знаниями? Можно почитать, что ты пишешь
:
V>Для этого не нужно никакого нового программного обеспечения. Те же таблицы MSOffice или LibreOffice позволяют упорядочить что угодно
Так их достаточно или нет?
V>Думаешь разделить представление и данные это удобно. Но это лишь создаёт ненужную сложность, тормознутость, ограничение на структуры данных.
И это при этом не имеет никакого отношения к знаниям. А что ты скажешь про современные архитектуры NLP сетей? Они же хранят в себе и данные, и связи между ними. Это уже базы знаний?
N>>Про знания говорят в терминах онтологий, семантических связей, концептуальных схем. Вот mind map — это как раз про это. V>Вот и попробуй записать код в картах разума.
Зачем?!! Ты точно человек, а не нейросеть?
V>Я пробовал, получается плохо.
Здравствуйте, Nuzhny, Вы писали:
V>>Для этого не нужно никакого нового программного обеспечения. Те же таблицы MSOffice или LibreOffice позволяют упорядочить что угодно N>Так их достаточно или нет?
К сожалению они как и ПИМы сливаются на действительно больших объёмах данных. Считай, что html это их скоростной аналог. Возможности форматирования гораздо выше, а скорость при объёмах не падает так катастрофично. То есть функционально их достаточно, а когда попробуешь создать огромный документ, тут и произойдёт лажа.
V>>Я пробовал, получается плохо. N>Не верю, что пробовал. Или покажи пример.
Лень искать. Помню недавно ты с меня требовал статистику по заработку мобильных приложений, мне тоже было лень искать. Я тебе её в итоге показал, на что ты ответил в стиле, что всё это ерунда. Так и что напрягаться. Просто представь схему с десятками тысяч элементов.
Опять же смотри, а на чём ты сам пишешь код? Почему, к примеру, твой код это не какая-то заумная карта разума, или ещё что, а простой текст, коим так же является html. Ну и как-то яснее выражай свои мысли, а то непонятно, что пытаешься до меня донести. Который комментарий уже по сути ни о чём.
Здравствуйте, velkin, Вы писали:
V>То есть функционально их достаточно, а когда попробуешь создать огромный документ, тут и произойдёт лажа.
Так а зачем создавать огромный документ?
Вообще, я считаю, что для базы знаний одностраничных документов вполне достаточно.
Ведь что такое многостраничный документ? Это тупо одномерный список одностраничных документов, когда писателю лень создавать упорядоченную структуру с гиперссылками и он фигачит поток сознания.
Здравствуйте, graniar, Вы писали:
V>>То есть функционально их достаточно, а когда попробуешь создать огромный документ, тут и произойдёт лажа. G>Так а зачем создавать огромный документ?
1) Чтобы работал поиск и замена по тексту.
2) Не нужно было переходить между файлами.
3) А ссылки перекидывали внутри документа.
4) Так же для повышения связности темы.
G>Вообще, я считаю, что для базы знаний одностраничных документов вполне достаточно.
А зачем книга сделана одной бумажной стопкой, можно же было сделать множество документов. Ещё и пронумерована и скреплена.
Представь, что заполняешь личную базу знаний и у тебя на некую тему вместо одного документа сто или тысяча. С одной стороны вроде бы хорошо, а с другой при каких-либо изменениях тебе придётся их все открывать и редактировать.
Однако у тебя нет ни поиска, ни массовой замены по множеству документов. А даже если в каком-то редакторе и есть, то порой придётся всё равно проверять вручную, следовательно открыть кучу документов. И не проще тогда редактировать один документ, проводить его реструктуризацию, чем лазить по куче файлов.
В некоторых редакторах есть дерево файлов, то есть показывается файловая система и файлы открываются и сразу редактируются. Но что происходит со вкладками такого редактора. А на вкладках начинает возрастать список открытых файлов и вместо того, чтобы мотать ползунок или искать поиском приходится переключаться между вкладками.
Проблема множества документов ещё и в том, что количество не переходит в качество. Для получения качества приходится анализировать всю тему, а если она разбросана по множеству файлов, то желательно просмотреть их все для улучшения документов.
Каждый может делать так, как ему удобно или вообще не делать. Я вот не уверен, что у тех кто тут со мной общается есть личная база знаний, которая действительно занимает важную роль в жизни конкретного человека, а то и вообще есть.
У меня её нет, хотя я пытался создать много раз. Следующая попытка будет на html, так как теоретически это должно сработать. Потому что работало на многократно скопированных объёмах данных и не тормозило. А там видно будет что произойдёт на реальных данных.
Здравствуйте, velkin, Вы писали:
V>Лень искать. Помню недавно ты с меня требовал статистику по заработку мобильных приложений, мне тоже было лень искать. Я тебе её в итоге показал, на что ты ответил в стиле, что всё это ерунда. Так и что напрягаться. Просто представь схему с десятками тысяч элементов.
Ты мне показал среднюю температуру по больнице. Я говорил про вполне конкретный кейс приложений, а ты мне про игры
V>Опять же смотри, а на чём ты сам пишешь код? Почему, к примеру, твой код это не какая-то заумная карта разума, или ещё что, а простой текст, коим так же является html. Ну и как-то яснее выражай свои мысли, а то непонятно, что пытаешься до меня донести. Который комментарий уже по сути ни о чём.
Я конкретно и опять говорю, что ты по своему извращаешь общепринятые термины. Ты называешь знаниями и базой знаний не знания и не базу знаний. Mind map хоть приблизительно этому соответствует, твоя html поделка — нет.
Здравствуйте, Nuzhny, Вы писали:
N>Я конкретно и опять говорю, что ты по своему извращаешь общепринятые термины. Ты называешь знаниями и базой знаний не знания и не базу знаний. Mind map хоть приблизительно этому соответствует, твоя html поделка — нет.
Здравствуйте, velkin, Вы писали:
V>Я вот не уверен, что у тех кто тут со мной общается есть личная база знаний, которая действительно занимает важную роль в жизни конкретного человека, а то и вообще есть.
У меня есть, больше сотни файлов; да, занимает важную роль.
V>Пользователи того же GitHub очень радуются "Markdown" не подозревая, что на русский это переводится как "Разметка дауна".
МГИМО финишт?
V>Каждый может делать так, как ему удобно или вообще не делать.
Про даунов ты прям с козырей ворвался, а теперь: «как ему удобно».
V>1) Чтобы работал поиск и замена по тексту.
В VS Code или любом подобном редакторе с аутлайном и списком файлов (Sublime, IntelliJ) поиск и замена по всем файлам удобно и быстро работают.
V>2) Не нужно было переходить между файлами.
Переходить между файлами гораздо удобнее, чем скроллить по монолитному полотну.
V>4) Так же для повышения связности темы.
А «тема» — это не что-то фиксированное и замкнутое в себе, она пересекается со множеством других тем. https://notes.andymatuschak.org/Evergreen_notes_should_be_atomic
V>А зачем книга сделана одной бумажной стопкой, можно же было сделать множество документов.
Так Луман в Цеттелькастене и делал множество карточек, индексировал их и настраивал перекрёстные ссылки.
V>Ещё и пронумерована и скреплена.
Во-первых, из логистических соображений, как ограничение носителя. В цифровом мире жёстких ограничений нет, целесообразность определяется иначе.
Во-вторых, книга — это не персональная база знаний (с целью кристаллизации знания), а публичная упаковка знаний (с целью передачи знания). Адресована не себе, а другим.
V>Однако у тебя нет ни поиска, ни массовой замены по множеству документов. А даже если в каком-то редакторе и есть
Почти в любом современном редакторе есть, обычно доступно по сочетанию Ctrl+Shift+F.
V>В некоторых редакторах есть дерево файлов, то есть показывается файловая система и файлы открываются и сразу редактируются. Но что происходит со вкладками такого редактора. А на вкладках начинает возрастать список открытых файлов и вместо того, чтобы мотать ползунок или искать поиском приходится переключаться между вкладками.
Так ненужные в текущий момент вкладки хотя бы можно закрыть. А простыня всегда распахнута.
V>Проблема множества документов ещё и в том, что количество не переходит в качество.
Именно что переходит, потому что выстраивается сеть связей между фрагментами (ссылки в Цеттелькастен — ключевое), в том числе связи между разными доменами.
А монолитный документ — это жёстко и негибко, внутри всё связано со всем; давать перекрёстные ссылки снаружи внутрь монолита — неудобно.
V>Для получения качества приходится анализировать всю тему
Обычно нет, нужно рассмотреть только релевантную информацию, и при необходимости походить по ссылкам или почитать индексную карточку.
V>а если она разбросана по множеству файлов, то желательно просмотреть их все для улучшения документов.
Википедия разбросана по множеству файлов. (И, заметь, никакой иерархии.) Смотреть все страницы при изучении какой-то темы необязательно (да и невозможно).
V>У меня её нет, хотя я пытался создать много раз. Следующая попытка будет на html, так как теоретически это должно сработать.
HTML как формат ввода, конечно, заметно хуже Маркдауна; но этот выбор сам по себе вряд ли станет решающей причиной неуспеха. А вот ориентация на таксономии (мир совершенно точно не устроен по иерархиям, как и знания о мире) и отказ от гранулярности в пользу монолитов — это уже режим провала.
Здравствуйте, velkin, Вы писали:
V>Личные знания людей прежде всего хранятся и обрабатываются в головах в нейронной сети во вполне физическом виде, назову это внутренним носителем. Но в большинстве случаев этого недостаточно и нужна дополнительная запись на внешние носители.
Любые знания имеют смысл лишь при их повторном использовании.
Знания часто устаревают, становятся неактуальными. В целом база знаний требует поддержки, затрат в том числе на систематизацию. В то же время потеря информации тоже имеет свою цену. Ты можешь спокойно не тратить время на сохранение какой-то информации, и это будет выгодно. Важно научиться отбрасывать ненужное. Поиск инфы — тоже затраты, если затраты на сохранение или каталогизацию выше чем потом при поиске — зачем они нужны?
К чему пришел я. В жизни у тебя есть проекты большие и маленькие, есть регулярные процессы. Знания же идут рука об руку с документами и вещами — это всё продукт минипроектов.
1. Два способа хранения инфы/доков — вещественный в виде коробок/папок и виртуальный в виде папок на яндекс.диске + почта — во втором случае инфа всегда с тобой.
2. Не надо вкладывать излишние усилия в стандартизацию, систематизацию и каталогизацию — достаточно осмысленно называть файлы и папки/коробки — потом найдешь нужное.
Появился некий кейс — например, возврат налогов, просто делаешь папку "возврат налогов 2019" — набрасываешь туда всё, что использовалось в ходе этого минипроекта — сканы доков, декларацию, список нужных документов. Делал ремонт в квартире — аналогично "квартира ленинский", если какие-то проекты были — бросаешь туда, фоткаешь схемы электрики сохраняешь "электрика", если проектов не было, но нужно помнить нюансы — просто создаешь текстовый файл и бросаешь в папку. Платишь регулярно за какие-то вещи? Делаешь файл "как платить.txt" — и набрасываешь там нюансы, которые надо иметь под рукой — номера счетов, логины/пароли (подсказки к оным) и т.п.
Делал технический проект для себя, какую-нибудь хреновину с автоматизацией? Заводишь под него папку — точно так же набрасываешь туда всё — сохраненные полезные страницы из интернета, свои мысли или заметки в текстовиках, проги если нужны были или код и т.д. — потом найдешь, разберешься, если потребуется, главное опиши финальное решение и кратко инструкцию по использованию, чтобы разобраться при перерыве в использовании, при поломках или доработках.
Всякие доки, запасные ключи и проч. по авто — коробка с именем "авто" — понадобится что-то, найдешь там быстро.
Инструкции храни рядом с используемым девайсом — к котлу на стене рядом с котлом, к кухонной технике — рядом с ней в шкафах или полочках, к снегоходу — на полке в сарае, где хранятся причиндалы для его обслуживания, всё по оружию (доки/патроны/чехлы) — в сейфе для оружия, и т.д.
В общем — обеспечь сохранение и облегчи поиск, когда понадобится — трать на это как можно меньше усилий, но не меньше.
>Личная база знаний одного человека может стать внешним источником знаний других людей, наглядный пример книги или статьи.
Книги и статьи как раз и пишутся так, чтобы могли быть источником для других — именно на это (на возможность использовать не только самому) тратится дополнительное время/усилия, порой довольно большие. Т.е. надо все-же различать — знания личные или для использования окружающими.