Викиданные в тегах

В октябре открыли проект Wikidata: централизованное структурированное хранилище данных и метаданных всех объектов (другими словами, базу знаний) под лицензией CC0. С 6 марта на него перевели систему интервики (как следствие, последней строчкой в списке языков висит ссылка на wikidata), а во второй и третьей фазах планируется автоматически обновлять из Викиданных инфобоксы и списки.

Количество объектов в хранилище приближается к десяти миллионам; каждый, в отличие от страниц википедии, имеет уникальный идентификатор вида «Q12345», не зависящий от языка и других объектов. Janko Mihelić месяц назад предложил использовать ссылку на викиданные в формате wikidata=Q234 паралелльно тегам wikipedia, а заодно по возможности снабжать такой ссылкой каждое значение-объект: например, architect:wikidata=*.

Другие осмеры сразу заметили, что новый тег а) неочевиден пользователям; б) дублирует тег wikipedia; в) ничем не поддерживается; г) может содержать несколько значений (поскольку объекты OSM могут обозначать несколько сущностей: например, теги магазина на контуре здания). Реакции разнятся — от «дурацкий тег, давайте его забудем» до «массово заменим wikipedia на wikidata!» Жаркие споры, вызванные этим пропозалом в рассылке и вики, проявляют не столько спорность предложения, сколько проблемы самого механизма пропозалов. Simone Saviolo подытожил:

Я слегка озадачен: долгие годы мы говорили, что OSM должен хранить только геоданные, а остальной информации место в отдельной базе данных. И теперь, когда появилась такая отдельная база, у неё оказалось столько противников.

Поделиться
Отправить
9 комментариев
Hind

Возможно, дело в том, что эта база неподконтрольна осму и кто её знает.

:3

pb

OSM должен хранить только геоданные, а остальной информации место в отдельной базе данных

всё правильно ведь — ссылка на другую базу — не геоданные. пусть лучше они хранят ссылку на осм, раз сами такие мета-централизованные.

Zkir

Ну нет в осм объектов. Есть графические примитивы.

putnik

Вторая фаза Викиданных уже началась. В русской Википедии и ещё 10 разделах уже можно использовать Викиданные для вставки информации.

Виктор

Мне кажется сейчас говорить о викиданных очень и очень рано. Они только появились, а мы уже лететь куда-то...

Я как разработчик внедрять, пока даже не знаю как. Кто не в курсе, то привязка в OSM к Wikipedia и обратно очень слабая. В смысле если взять статьи Wikipedia с lat/lon (а этих форматов там штук 10 — лучше бы этим занялись), то их окажется в 10 раз больше, чем ссылок с osm на wikipedia. Поэтому я видел бы смысл в автоматизации и добавлении wikipedia ко всем возможным объектам.

В конце концов когда в викиданных будет хотя бы 95% статей, тогда имеет смысл добавлять, а так шило на мыло + дублируется + еще и не все содержится.

putnik

2Виктор:
В Викиданных должны быть все статьи, которые есть во всех разделах Википедии. Какое сейчас покрытие, найти не смог, но там сейчас 9 млн записей (в английской ВП — 4,1).

С координатами, кстати, ситуация очень сильно упрощается: они все будут храниться в Викиданных, не различаясь от языка к языку, и будут доступны в одном формате. Есть ощущение, что их всё-таки включат уже в апреле. До этого момента имхо дёргаться не стоит, а вот после вполне можно переходить на тег для Викиданных вместо Википедии.

OverQuantum

Нужен сервис, который позволяет по-простому открыть пользователю статью на википедии, желательно с заданием списка предпочтительных языков (например, локальный пользователю -> английский -> локальный для объекта -> любой).
Сейчас по ссылке из пропозала открывается страница wikidata-ы со списком ссылок, что сильно не user-friendly.
Пока такого сервиса нет — заменять нельзя, я считаю.
Только добавлять тэг wikidata не удаляя тэга wikipedia.

freeExec

Не совсем понял, это сервис где должен быть ? А то тут буквально неделю назад просили внедрить в JOSM открытие ссылок вида wikipedia=ru:блабла

putnik

Где угодно. Это может быть QRpedia, например, если они прикрутят переход по ID’шникам Викиданных. Вообще, как будет время, я постараюсь допилить код QR-педии, идея-то хорошая.