Re[2]: Интерфейс к Википедии?
От: Sharowarsheg  
Дата: 04.09.19 10:26
Оценка: 4 (1) +1
Здравствуйте, alpha21264, Вы писали:


A>Возникла такая идея (одна из многих).

A>Брать материал из Википедии, хотя бы определения некоторых понятий.
A>Как это можно проще всего сделать?

есть вариант вот такой

https://en.wikipedia.org/wiki/Wikipedia:Database_download

и дальше по ссылкам
Re[3]: А давайте напишем бредогенератор.
От: Sharowarsheg  
Дата: 03.09.19 14:34
Оценка: +1
Здравствуйте, alpha21264, Вы писали:

A>Ну вот как это сделать, чтобы не сразу было видно, что это делал робот?


Словарь синонимов, подобранный под предметную область. Кроме того, по шаблону можно предложения целиком матчить и переводить одни в другие (то же самое, что словарь синонимов, только для предложений и вообще грамматических конструкций).

Какие-то орлы взяли Майн Кампф, поменяли там арийцев на женщин, и отправили в феминистический журнал — прошло на ура.
Re: А давайте напишем бредогенератор.
От: Muxa  
Дата: 03.09.19 16:30
Оценка: +1
A>возникла идея написать программный генератор научных статей.

забирай
А давайте напишем бредогенератор.
От: alpha21264 СССР  
Дата: 03.09.19 12:37
Оценка:
Товарищи!

В одном нашем ведущем ВУЗе (входящем в первую десятку)
злое начальство стало требовать какое-то нереальное количество научных статей.
Знаю, знаю, это делается с целью уничтожить ВУЗ.

Поскольку ВУЗ имеет отношение к лингвистике,
возникла идея написать программный генератор научных статей.

Предложите идеи, как это можно сделать, так чтобы получался приемлемый результат.
Про цепи Маркова знаю.

Течёт вода Кубань-реки куда велят большевики.
Re: А давайте напишем бредогенератор.
От: L.K. Марс  
Дата: 03.09.19 13:51
Оценка:
A>приемлемый результат.

А что такое "приемлемый"? Статьи же должны рецензироваться, печататься в журналах, на статьи должны ссылаться, по авторам статей считаются всякие там индексы Хирша.

А если всё это как-то обходится, то можно нарезать куски из старых статей, поменять слова по базе синонимов и написать "вручную" пару абзацев для "уникальности".
Re: А давайте напишем бредогенератор.
От: velkin Земля  
Дата: 03.09.19 13:58
Оценка:
Здравствуйте, alpha21264, Вы писали:

A>Поскольку ВУЗ имеет отношение к лингвистике,

A>возникла идея написать программный генератор научных статей.

Это лишь увеличит рассеивание знаний, а ведь можно сделать вручную наоборот сжав их в минимальном объёме.
Re[2]: А давайте напишем бредогенератор.
От: alpha21264 СССР  
Дата: 03.09.19 14:09
Оценка:
Здравствуйте, velkin, Вы писали:

V>Здравствуйте, alpha21264, Вы писали:


A>>Поскольку ВУЗ имеет отношение к лингвистике,

A>>возникла идея написать программный генератор научных статей.

V>Это лишь увеличит рассеивание знаний, а ведь можно сделать вручную наоборот сжав их в минимальном объёме.


В данном случае стоит задача защитить профессоров от "эффективных менеджеров",
и дать им возможность заниматься настоящей научной работой.

Течёт вода Кубань-реки куда велят большевики.
Re[2]: А давайте напишем бредогенератор.
От: alpha21264 СССР  
Дата: 03.09.19 14:13
Оценка:
Здравствуйте, L.K., Вы писали:

A>>приемлемый результат.


LK>А что такое "приемлемый"?


Это человеческий критерий. Эстетический.

LK>Статьи же должны рецензироваться, печататься в журналах, на статьи должны ссылаться, по авторам статей считаются всякие там индексы Хирша.


Ну вот они так же и рецензируются. Маразм же происходит во всех частях системы одновременно.
Индекс Хирша изначально был маразмом.

LK>А если всё это как-то обходится, то можно нарезать куски из старых статей, поменять слова по базе синонимов и написать "вручную" пару абзацев для "уникальности".


Ну вот как это сделать, чтобы не сразу было видно, что это делал робот?

Течёт вода Кубань-реки куда велят большевики.
Re[3]: А давайте напишем бредогенератор.
От: Sharowarsheg  
Дата: 03.09.19 15:09
Оценка:
Здравствуйте, alpha21264, Вы писали:

Марков, кстати, тоже сложнее, чем кажется, если брать абзацы и ключевые слова в них в качестве единиц. Опять же, нужен будет словарь ключевых слов, взять несколько статей, разбить на абзацы, в каждом найти ключевые слова, и к этому применить марковские правила.
Re: А давайте напишем бредогенератор.
От: LaptevVV Россия  
Дата: 03.09.19 16:05
Оценка:
A>возникла идея написать программный генератор научных статей.
Это про корчеватель, что ли?
Хочешь быть счастливым — будь им!
Без булдырабыз!!!
Re[2]: А давайте напишем бредогенератор.
От: alpha21264 СССР  
Дата: 03.09.19 16:22
Оценка:
Здравствуйте, LaptevVV, Вы писали:

A>>возникла идея написать программный генератор научных статей.

LVV>Это про корчеватель, что ли?

Да. Но корчеватель был сделан предельно примитивно, а я хочу сделать по уму.

Течёт вода Кубань-реки куда велят большевики.
Re: А давайте напишем бредогенератор.
От: Pzz Россия https://github.com/alexpevzner
Дата: 03.09.19 16:35
Оценка:
Здравствуйте, alpha21264, Вы писали:

A>Предложите идеи, как это можно сделать, так чтобы получался приемлемый результат.

A>Про цепи Маркова знаю.

Ну, сейчас для этого нейросети вроде модно использовать...
Re[2]: А давайте напишем бредогенератор.
От: alpha21264 СССР  
Дата: 04.09.19 08:50
Оценка:
Здравствуйте, Pzz, Вы писали:

Pzz>Здравствуйте, alpha21264, Вы писали:


A>>Предложите идеи, как это можно сделать, так чтобы получался приемлемый результат.

A>>Про цепи Маркова знаю.

Pzz>Ну, сейчас для этого нейросети вроде модно использовать...


Не у всех есть бюджет Гугла.

Течёт вода Кубань-реки куда велят большевики.
Re: Интерфейс к Википедии?
От: alpha21264 СССР  
Дата: 04.09.19 08:53
Оценка:
Здравствуйте, alpha21264, Вы писали:

A>Поскольку ВУЗ имеет отношение к лингвистике,

A>возникла идея написать программный генератор научных статей.

A>Предложите идеи, как это можно сделать, так чтобы получался приемлемый результат.

A>Про цепи Маркова знаю.

Возникла такая идея (одна из многих).
Брать материал из Википедии, хотя бы определения некоторых понятий.
Как это можно проще всего сделать?

До сего момента ничего сетевого не программировал, знаю только wget.
Подозреваю, что есть целые технологии на эту тему.

Течёт вода Кубань-реки куда велят большевики.
Re[2]: Интерфейс к Википедии?
От: Эйнсток Файр Мухосранск Странный реагент
Дата: 23.09.19 15:02
Оценка:
A>Как это можно проще всего сделать?

Можно вроде архив всей википедии выкачать в виде файлов, потом файлы локально обрабатывать

S> Wikipedia:Database_download


да, оно.

14 GB compressed (expands to over 58 GB when decompressed).
Отредактировано 23.09.2019 15:04 Эйнсток Файр . Предыдущая версия .
Re: А давайте напишем бредогенератор.
От: NotImplemented США github.com/NotImplemented
Дата: 15.10.19 16:38
Оценка:
Здравствуйте, alpha21264, Вы писали:

A>Предложите идеи, как это можно сделать, так чтобы получался приемлемый результат.

A>Про цепи Маркова знаю.

Конечно же, рекуррентные нейронные сети.
https://github.com/minimaxir/textgenrnn
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.