Восточные языки Википедии, - Анна Глазова 09:26 01.09.2015
Наиболее "продвинутые" разделы Википедии на восточных языках
Забавным кажется, что в статистике Википедии по количеству статей несколько передовых мест занимают восточные языки, о которых многие даже и не слышали. Так, более миллиона статей существуют на варайском, себуанском и вьетнамском языках, занимающие соответственно 6-ую, 9-ую и 11-ую позиции. Для сравнения, русский раздел занимает 7-ую позицию, а испанский - 10-ую. Как это объяснить?
Дело в том, что бо́льшая часть статей (более 50 %) варайской, себуанской и вьетнамской википедий были созданы при помощи ботов, то есть специальных программ для совершения рутинных операций. Чаще всего основным содержимым таких языковых разделов являются автоматически созданные заготовки о биологических видах, состоящие из 2-3-х предложений и шаблона-карточки.
Массовая заливка заготовок для себуанской и варайской википедий велась с начала 2013 года участником, ответственным за шведскую ботозаливку. К концу сентября 2014 года себуанский и варайский разделы вышли по количеству статей соответственно на 6-ое и 7-ое места.
Во вьетнамскую википедию с начала 2012 года велась массовая заливка заготовок о биологических видах (переводились нидерландские заготовки). Это позволило вьетнамскому разделу в сентябре 2013 года выйти на 10-е место, а к июлю 2014 года - на 9-ое место по числу статей. Усиление ботоактивности варайской и себуанской Википедий сместило к концу лета 2014 года вьетнамский раздел на 11-ое место.
Языковой раздел википедии на языке минангкабау был создан в начале 2013 года, а 29 августа была начата массовая заливку заготовок о биологических видах, которые переводились из шведской википедии.
Благодаря очень высокой скорости заливки уже к 11 сентября 2013 года этот языковой раздел вышел на 28-ое место по количеству статей (220 тысяч), а в настоящее время занимает 31-ое место. Из-за этой ботозаливки по состоянию на май 2015 года он имеет рекордно низкий показатель глубины - 0,007.
На 1 сентября 2015 года ситуация по прочим разделам восточных языков с количеством статей более 100 тысяч выгладит следующим образом (в скобках указана позиция в ряду всех языковых разделов Википедии):
японский (13),
китайский (15),
персидский (18),
арабский (21),
индонезийский (23),
корейский (27),
малайский (29),
турецкий (30),
казахский (33),
армянский (38),
иврит (39),
узбекский (44),
хинди (51),
чеченский (52).
Глазова А.В.
|