kouprianov: (Default)
ars.colored.gender

Клуб клиентов Диссернета, в общем, довольно мужской, вполне на уровне мировых достижений. Забегая вперед, скажу, что доля женщин (~25%) не зависит от роли (автор, руководитель, оппонент). На этой картинке -- все (от авторов до оппонентов), мужчины синие, женщины -- красные, несколько человек неясно какого пола -- серые. Кто надумает качать: полный размер картинки -- пять на пять тысяч, а весит она 5.4 МБ (по нынешним временам не много, но знать надо).

kouprianov: (Default)

Это, собственно, извлеклось и посчиталось одним из первых, но почему-то руки не доходили выложить. Это кусочки кандидатской или докторской степеней, от которых откушены слова «кандидат» или «доктор». Всего это поле заполнено в 644 записях из 648.

Картинку и таблицу под cut... )
kouprianov: (Default)

aa.rs После упорядочения списков имен авторов, руководителей и консультантов, а также официальных оппонентов возникло искушение порисовать сетки. В качестве примера того, что может получиться, покажу сеть авторов, связанных через общих руководителей и оппонентов (изолированные авторы не показаны). Серые полосочки -- это, на самом деле, имена и фамилии, только малесенькие-малесенькие. Их однако можно разглядеть при просмотре в полную величину (осторожно -- это пять на пять тысяч точек). Надо еще проверять, но сегменты сетей должны чему-то соответствовать -- не то защитным советам, не то организациям, в которых выполнены работы, но скорее всего -- каким-то чуть более сложносочиненным фрагментам академических мафий. Пожалуй, временно отвлекусь от них и займусь другими делами.

kouprianov: (Default)

Продолжаю вглядываться в списки Диссернета. Вроде бы, вычистка от дублей идет к концу. На настоящий момент имеется 629 авторов, 437 научных руководителей и 1004 официальных оппонента.

При сопоставлении списков (сопоставляю, разумеется, не я, я только чищу то, что неподвластно машине, а сопоставляет intersect()) выяснилось, что 65 руководителей отметились также и среди рецензентов, 15 авторов диссертаций успели побывать руководителями и 10 -- рецензентами, при этом четверо успели выступить во всех трех амплуа. Как мне кажется, это указывает на то, что выявленный сегмент сети работает не столько на воспроизводство сообщества, сколько на экспорт (как я понимаю, авторы тут, в основном, чиновники). В качестве бонуса -- список четырех потенциальных передовиков-многостаночников.

Bonus... )

kouprianov: (Default)

Продолжаю возиться с dataset'ом на основе материалов Dissernet.org. Упорядочил еще два поля -- научные руководители / консультанты и официальные оппоненты. Всего поле «руководитель / консультант» было заполнено в 539, а «официальные оппоненты» -- в 555 из 648 карточек. Списки на настоящий момент включают 439 предположительно уникальных имен руководителей и консультантов и 1006 имен предположительно уникальных официальных оппонентов. Не менее 57 человек фигурируют в обоих списках (один даже попал в приводимые ниже top-13 и top-10). Теперь -- пара таблиц и пара картинок.

пара таблиц и пара картинок... )
kouprianov: (Default)

diss_by_hostorg.hist Закончил первый раунд очистки сортиров при авгиевых конюшнях. Как я уже говорил, решил посмотреть на данные, выложенные в сеть проектом Диссернет. На настоящий момент удалось скачать массив из 648 страниц (некоторые, весьма немногие, совершенно пустые), вынуть из него (1) имена диссертантов, (2) названия диссертаций, (3) степени, на соискание которых эти диссертации были представлены и, по возможности, коды специальностей, (4) имена научных руководителей и / или консультантов, (5) имена официальных оппонентов и названия ведущих организаций, (6) названия организаций, в которых были подготовлены диссертации, (7) названия советов, в которых происходила защита, (8) даты защит. Естественно, полный набор данных доступен не для каждой диссертации, но некоторые поля заполнены почти у всех.

В ознаменование частичной победы над мусором в коде и пугающим разнообразием вариантов написания названий одних и тех же организаций, выкладываю top-10 организаций по количеству диссертаций, подготовленных клиентами «Диссернета», и картинку. Поле «диссертация подготовлена в...» было заполнено в 628 случаях, всего пока получилось 257 организаций (есть еще перспективы по незначительному сокращению списка за счет выявления еще какого-то количества синонимов, но на структуру лидирующей группы это не повлияет), филиалы рассматривались как отдельные организации. Оценку степени самостоятельности работ я в данном случае не провожу -- это дополнительная довольно трудоемкая работа, даже при полуоткрытых данных; только список тех, кто так или иначе попал в базу на настоящий момент.

1. Академия народного хозяйства при Правительстве РФ / Российская академия государственной службы при президенте РФ [РАНХиГС] -- 49 клиентов (7.80% от всех работ).
2. Московский педагогический государственный университет [МПГУ] -- 26 (4.14%)
3. Научный центр сердечно-сосудистой хирургии им. А. Н. Бакулева РАМН -- 23 (3.66%)
4. Московский государственный институт электроники и математики (технический университет) [МИЭМ] -- 17 (2.70%)
5. Российский государственный гуманитарный университет [РГГУ] -- 15 (2.49%)
6-7. Российский государственный социальный университет [РГСУ] -- 14 (2.23%)
6-7. Санкт-Петербургский государственный университет Государственной противопожарной службы МЧС РФ -- 14 (2.23%)
8-10. Московский государственный медико-стоматологический университет им. А. И. Евдокимова -- 13 (2.07%)
8-10. Московский государственный университет им. М. В. Ломоносова [МГУ] -- 13 (2.07%)
8-10. Санкт-Петербургский государственный инженерно-экономический университет [ИНЖЭКОН] -- 13 (2.07%)

September 2017

S M T W T F S
     12
34567 89
10111213141516
17181920212223
24252627282930

Syndicate

RSS Atom

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 19th, 2017 05:10 pm
Powered by Dreamwidth Studios