95 заметок с тегом

источники

Slide!

Нам снова разрешили использовать тепловую карту точек Strava для улучшения карты. Участник PangoSE из Швеции воспользовался лучшим способом для открытия данных с непонятным статусом: написал письмо с вопросом. И старший менеджер продукта Strava Metro ответил: мол, да, не видим в этом ничего плохого. Но есть ощущение, что и разрешение не то, и данные как-то уже не нужны.

Strava — это соцсеточка для фитнеса: выдаёт задания и отслеживает маршруты и показатели, позволяя хвастаться ими нажатием кнопки. С 2014 года часть карт на их сайте и в мобильных приложениях перешли на OSM. В то время в компании работал Пол Мак, автор многих гео-библиотек на Go, велосипедист и осмер. На SotM US в Вашингтоне он показал Strava Slide: форк редактора iD, который добавлял подложкой тепловую карту точек из велосипедных треков Strava и позволял одной кнопкой оформлять их в дороги для OpenStreetMap. Через пару дней Пол твитом разрешил рисовать карту по этому слою. Подложку добавили в JOSM и iD и начали по ней уточнять велодорожки и тропы в лесах.

После того, как в январе 2018 года студент австралийского университета нашёл на их карте маршруты пробежек вокруг военных баз по всему миру, Strava начала закручивать гайки. Помимо прочего, тепловая карта потеряла в детальности: огромные квадратики уже не помогали в уточнении OSM. Редактор Slide перестал работать, его подложка расплылась. Картографы не хотели терять такой источник информации: в отличие от осма с его двумястами треками в день, на карту Strava загружают двести тысяч велопоездок в день. Поэтому мы писали в компанию — но безответно. Неразмытые тепловые карты убрали из публичного доступа, пусть их и можно было достать, подставив регистрационные токены. Но молчание вкупе с закрытием означало, что разрешения на обводку в OpenStreetMap у нас нет. Если книгу, которую раньше можно было взять в библиотеке, спрятали на заднем дворе под замком, то наличие отмычки не даёт права её копировать.

16 ноября пятилетнее молчание прервалось: Родриго ответил, что они там все очень любят OSM. Сквозь телеграм-чатики, вики и почтовые рассылки пронеслось радостное письмо PangoSE, вики недвусмысленно говорит: «OpenStreetMap users have permission to use the data». Русскую вики-страницу летом полностью переписал участник PG7: на ней не только красочная история взаимодействия сообщества и компании, но и перечисление способов, как детальную тепловую карту подключить в JOSM и iD. Последние методы сводятся к подключению прокси-подложек с сервера Макса Кожина, про которые тот рассказал на хабре.

Проблема очевидна: разрешение-то где? Слова «мы не против» — лишь слова, пока не подкреплены делом. У нас нет однозначного «да, мы разрешаем». И у нас нет способа получить эти тайлы, не взламывая систему доступа и не нарушая условия использования, которые всё так же не упоминают OSM. Продолжая метафору выше, старший библиотекарь не против, что вы взломаете дверь, за которой книга, но само действие всё ещё противоправно. Об этом легко забыть, читая статью в нашей вики, написанную с позиции «что не запрещено — разрешено». Но по части лицензий многие осмеры стараются блюсти осторожность, запрещая использование источников с сомнительными условиями, типа русской кадастровой карты или панорам гугля. Другие картографы, вкусившие картографической свободы, бесятся от таких нелогичных на первый взгляд ограничений. Принцип «Нет значит нет» принимают не во всех культурах, и в России особенно. Что уж говорить про «отсутствие „да“ тоже значит нет».

Если в ближайшие месяцы (или годы, учитывая скорость реакции) обе проблемы решат, то у нас появится легальная подложка велотреков Strava. И возникнет следующий вопрос: а зачем? Ну, то есть, интересно посмотреть, где катаются велосипедисты, какие маршруты чаще выбирают. Но вы посмотрите на окрестности городов: за эти пять лет велосипедисты уже отметили всё что только можно. Они теперь планируют маршрут по карте OpenStreetMap, а не карта OSM рисуется по маршрутам их покатушек. Найти важную неотмеченную велодорожку, пользуясь тепловой картой, о-очень нетривиально. Это как искать пропущенную улицу в Нью-Йорке, пользуясь треками машин Juno. Она там есть, но спрятана среди десяти тысяч других улиц.

Чтобы тепловая карта Strava приносила пользу, а не лежала, спрятанная в подпапке «другое» меню слоёв JOSM, нужна автоматизация. Да, OpenStreetMap уже на том этапе развития, когда обклацывать подложки руками почти так же лениво, как обрабатывать обходные листы с прогулок. Есть же умный компьютер с нейросеточками — пусть он и работает. Дороги на снимках ищет фейсбуковский RapiD, пропущенные дороги и запреты поворотов отслеживают валидаторы. Пользу от стравовских треков принесёт только векторизатор в паре со сравнивалкой с OpenStreetMap. Или, хотя бы, достаточно мощный API, чтобы подобные инструменты мог написать кто-то другой. Но в свете продолжающегося закручивания гаек во второй половине этого года, оба исхода одинаково маловероятны.

Шесть-восемь лет мы радовались каждому источнику. Считали области, покрытые кадастровой картой. Внимательно следили за картой покрытия детальными снимками Bing и праздновали соглашение между Mapbox и DigitalGlobe. Источников было мало, а карту хотелось рисовать в каждом посёлке, поэтому мы хотели больше. Спутниковые слои были будущим OpenStreetMap. Новый слой значил новые покрытые города, что означало, что наши данные в этих городах смогут состязаться с народной картой, чьи картографы нежились на горах яндексовских снимков.

Теперь же нам, в общем, пофиг. Открыл редактор — выбирай из шести спутниковых слоёв со всемирным покрытием и ещё из нескольких региональных. Есть слой треков, есть Mapillary и OpenStreetCam, есть OpenAerialMap. Источников гора — а обрисовывают всё равно только Bing, который редактор iD показывает по умолчанию. Нам нечего желать: от «что бы обрисовать» мы дошли до «кто бы отрисовал». Мы очень остро почувствовали нехватку участников в OSM, и справляемся с ней по-разному. Кто-то ушёл в отрицание: мол, опытный участник лучше дюжины новичков, и уж точно лучше автоматики. Гуманитарная команда и другие организации собирают залы проектами навроде Missing Maps. Потом считают, сколько процентов пришли во второй раз (очень мало). Третьи поворачиваются к открытым данным.

Открытые данные и есть источник будущего для OpenStreetMap. Их не нужно обклацывать, разве что быстренько прощёлкать для проверки (сейчас как раз смотрят на театры в России). Данных много: одних только адресов проект OpenAddresses собрал полмиллиарда. Они не сильно конкурируют с обычными картографами: десять человек могут обклацать снимки целого региона, а вот объехать и собрать информацию о всех заправках или гипермаркетах будет сложнее. Сюда же можно добавить сотни миллионов распознанных нейросеточками домов. И, конечно, дороги и «зелёнка», время от времени появляющиеся в разных странах Европы и Северной Америки. Использование не подложек, но данных со стороны, — это и есть неминуемое будущее создания открытой карты. Поздно ругаться: почти все крупные компании, подсевшие на OSM, делают импорты разных видов, и пора перестать делать вид, что их нет.

Именно этого я бы ждал от Strava, если их гео-команда действительно заинтересована в улучшении OpenStreetMap. Не растрового слоя, а данных. Проект Strava Metro уже векторизует линии поездок для оценки и планирования транспортных сетей. Дело за малым: посмотреть, как эти транспортные сети обозначаются в OSM, совместить данные, найти промежутки, которые стоит заполнить. А дальше уже получить пользу от совмещения данных: например, используя данные о городах и туристической инфраструктуре, одной кнопкой строить потенциальные коридоры для региональных веломаршрутов. Главное — понимать, чем OpenStreetMap может помочь бизнесу, и принять его особенности. Из этого может родиться взаимополезный обмен данными. А без понимания мы имеем только скрытый слой разноцветных точек и редкие невнятные реплики от компании.

30 ноября   источники

Что за Maxar?

Три недели назад вы могли заметить новый слой спутниковых снимков в вашем редакторе: DigitalGlobe Vivid. А неделю назад — что его заменили два других, тоже на весь мир: Maxar Standard и Maxar Premium. Откуда они и зачем?

Быстрое гугление показывает, что Maxar Technologies получилась в октябре 2017 года слиянием MDA Holdings и DigitalGlobe. Объединённая компания занимается всем, что связано с космосом и спутниками. Теперь ещё и продажей космоснимков. Все сотрудники перешли в Maxar, и они не собираются отзывать разрешение на обрисовку снимков у OpenStreetMap. Никто не делал заявлений на этот счёт, но пул-реквесты в каталог подложек показывают, что в Maxar помнят про сотрудничество и обновляют ссылки.

Новые слои отличаются от старых. Технически — тем, что они не проходят через серверы Mapbox, а отдаются напрямую с DG. Содержанием тоже. В описании Maxar Premium упоминается, что это то же, что DG +Vivid, который нам два года назад выдали в слое DG Premium. Сравнение снимков в десяти городах показало, что чаще всего оба новых слоя совпадают, а если нет, то свежее может быть как Standard (в Новосибирске), так и Premium (в Калининграде). Но в паре мест — в районах Москвы, Петербурга и Саранска — самым свежим оказался DG Premium.

Это печально, потому что старые слои DigitalGlobe отключат не позднее 30 июня. Мы потеряем как самые свежие снимки, по которым можно нарисовать стадион в Саранске, так и самые старые, которые напомнят, как выглядели города до строительного бума. Представители Maxar пока не отвечают на вопросы, но на всякий случай, не откладывайте рисование новых жилых комплексов и инфраструктуры. Конечно, через год-два они появятся на всех слоях, но у нас же самая актуальная и точная карта сегодня, а не через год.

2019   источники

Агентам справочника вход воспрещён

Анна из «народной карты» расписала в их блоге, откуда берутся заведения на картах яндекса. В компании ведут два набора данных: «справочник» и «народная карта». Копирование данных налажено пока только из карты, скоро будет и обратное. И этот поток автоматических правок будет куда сильнее: ведь доля пользовательских данных в наполнении справочника очень мала.

Здесь всплывают две темы: постепенное замещение картографов-любителей роботами на «народных картах» под безграничное терпение первых и приоритеты в картографировании заведений. Обе темы подчёркивают радикальное отличие и «народных карт», и просто карт Яндекса от OpenStreetMap во всех своих ипостасях.

Приоритеты

В заметке перечислены восемь источников данных о заведениях, которые склеиваются и доступны из поиска на карте: правки народных картографов, сообщения из разных видов обратной связи, информация от организаций и от оплачиваемых сборщиков данных. Сколько из них есть в OSM? Только два: правки осмеров и заметки на сайте. Хотя, честно говоря, заметками владельцы заведений не пользуются, потому что их почти невозможно найти.

Где всё остальное? Ладно, у нас нет службы поддержки и сотрудников, обзванивающих организации. Но многие компании специально платят, чтобы их филиалы наносили на карты — и мы осознанно сопротивляемся этим «импортам». Что хорошо для всех популярных карт, оказывается плохо для OpenStreetMap. Как же так?

Дело в целевой аудитории. Кто адресат нашей карты, для кого мы рисуем? На сайте и в вики про это ни слова. «OSM предоставляет данные тысячам сайтов» — ничего не значащее утверждение, этот блог тоже предоставляет. А если OSMF и администраторы сайта отказываются ограничить ЦА карты, за них это сделают сами картографы. Самым очевидным способом.

OpenStreetMap — это карта для картографов под открытой лицензией. Два тезиса, которые определяют все решения в проекте. Открытая лицензия регулирует отношения со внешним миром: запрет на нелегальные данные и обклацывание гугля, публикацию планеты под ODbL, экосистему открытого кода. А первый тезис, что целевая аудитория — это картографы, регулирует все вопросы внутри сообщества. Прежде всего, конечно, тегирование, требования к редакторам и выбор допустимых слоёв для импортирования.

Самое неочевидное, что следует из ориентированности на редакторов карты, — это ограничение на размер данных. Когда их становится слишком много (например, после массового импорта «зелёнки»), сообщество бунтует и заводит reverter. OSM состоит из одного слоя, который непросто разделить по типам объектов, поэтому один перегруженный слой затрудняет редактирование остальных. Нарисовали схему помещений — контур здания теперь не улучшить. Импортировали Corine — проще закрыть редактор, чем обозначить вырубку. Обозначили каждый лоток на рынке — никто не будет обновлять информацию, да и проходы трогать побоятся.

Поэтому участники неодобрительно смотрят на импорты заведений. С одной стороны, пользователям карты хорошо: можно найти в любимом Maps.Me или OsmAnd заправку по пути и кафе у гостиницы. С другой, мы рисуем OSM не для пользователей: сотни тысяч, если не миллионы, импортируемых точек нужно проверять, поддерживать, обновлять. Никто этим не будет заниматься, а потому они не должны быть частью карты. Карта — для того, что интересно рисовать и несложно поддерживать.

Роботы

Задачу поддержки заведений из сторонних источников решить несложно: периодически проверять и импортировать заново. От картографов ничего не понадобится, только верить и не мешать. Разумеется, правки импортированных данных сохранятся после обновления — или нет, смотря сколько времени прошло. В перспективе это можно распространить на «зелёнку» и адреса.

Получится, что за существенную часть данных OpenStreetMap — сотни миллионов объектов — будут отвечать роботы, пусть и курируемые людьми. Медленно процесс поддержки данных OSM будет мигрировать к модели википедии, когда в истории правок любой статьи минимум 10% правок идут от роботов, следящих за порядком. Потому что если можно импортировать, то почему нельзя автоматически amenity=sauna заменять на leisure=sauna? Логично же это поручить роботу и спать спокойно, зная, что база консистентна?

В народных картах Яндекса это само собой разумеется. Там автоматизировано всё: импортирование данных в новых странах, сдвиг объектов при обновлении снимков, обновление данных из справочника. Роботам помогают сотрудники на зарплате и участники «Толоки», которых всё больше. Когда нужна актуальная и полная карта, полагаться на добровольных картографов-любителей недостаточно — это очевидно примерно всем. Поэтому народная карта мигрирует влево по шкале свободы картографии, усиливая контроль над содержимым карты.

Активным участникам сообщества НЯК это, конечно, не нравится. Данные от людей на зарплате предсказуемо хуже работы любителей — по всем показателям, кроме тех, что входят в ТЗ. «Теперь я не слежу за порядком. Спасибо яндексу за это», — хлопают дверью модераторы. Да и под заметкой про интеграцию справочника немало недоумённых комментариев. Это всё люди, которые не успели перестроиться три года назад и не поняли, что «народная карта» больше не самостоятельная песочница, где можно в одиночку нарисовать и поддерживать город, а инструмент обратной связи к картам Яндекса. Народные картографы теперь не столько правят карту, сколько корректируют импортированное и нарисованное профессионалами.

Очевидно, что автоматические правки противоречат целям сообщества OpenStreetMap: иметь карту, которую весело редактировать. Картограф с опытом всегда найдёт, какую претензию предъявить оператору любого скрипта. Данные плохо привязаны. Теги неправильные, но замена неравнозначна. Формат телефонного номера не тот. Это дискриминация против малого бизнеса. Хорошо, но проверяй каждый объект вручную. Этим атрибутам не место в OSM. Посмотрите на TIGER, хотите повторения? Любой импорт или автоматическая правка должны пройти через болото уныния, и редкий энтузиаст доползёт до его середины.

Мы говорим «карту может поправить каждый», но мы же и говорим «карта для любителей, а не корпораций». Мы ратуем за карту без дискриминации, но в то же время рисуем таблички про вход воспрещён. Открытый проект, но пожалуйста, не надо. Решить это противоречие может сильная структура, наделённая правом окончательного голоса. Но в нынешней парадигме «Совет + рабочие группы» такая структура невозможна. Тут либо делать альтернативный проект, либо повторить то, что Стив Кост сделал четырнадцать лет назад: выкручиваться малыми силами, находя новые смыслы в существующих структурах. И не сказать, что это невозможно. Продолжение.

2018   ВНЕЗАПНО   источники   няк

Знаки

Вчера на форуме в очередной раз высказали мнение, что будущее открытой картографии — за автоматическим распознаванием. Несколько компаний исследуют это направление уже много лет. Самая заметная из них — Mapillary, «народные панорамы». Дождавшись, когда база фотографий подрастёт до сотен миллионов, они начали выяснять, что же на них запечатлено. В январе 2015 года Mapillary показали слой с дорожными знаками и спустя несколько месяцев добавили его в JOSM и iD.

Две недели назад они анонсировали большое обновление набора дорожных знаков. За это время от машинного зрения они перешли к машинному обучению, прокатали через него на порядок больше снимков, а в октябре ещё и запустили «игру», в которой человеку нужно оценить точность распознавания.

Telenav с их конкурирующим проектом OpenStreetCam занимается примерно тем же — но с конкретной целью улучшить OSM, а не только собрать базу «на всякий случай». Филипп Кэндал, руководитель разработки, рассказал в 2016 году, что его команда пишет распознавалку знаков и указателей и уже уточнила двадцать тысяч ограничений на карте. За автоматикой, по его словам, будущее.

Для картографов OSM знаки в плагинах Telenav появились только в феврале этого года: всего полмиллиона и лишь в США и Канаде. Зато они сравнивают распознанные ограничения с данными OpenStreetMap, и картографов можно оповестить о необходимости уточнить карту. В апреле эту функциональность добавили в модуль для JOSM.

Наконец, в мае Telenav снова признался в верности открытому сообществу, опубликовав весь код распознавания знаков и натренированную модель под открытой лицензией Mozilla. Саму базу знаков тоже скоро откроют. Мартайн предлагает задействовать эту нейросеточку для распознавания новых типов объектов: скамеек, фонарных столбов, остановок. Чтобы это открытие не прошло незамеченным, Telenav объявил конкурс: сделайте свой проект до 17 августа и выиграйте 10 тысяч долларов — если он распознает более 94% объектов. Условия расплывчаты — вероятно, более опытные участники таких конкурсов поймут, что к чему.

А что Mapbox? Странным образом, они тоже участвуют в этом ажиотаже — но до недавнего времени только командой картографии. В 2016 году они собрали интерактивную карту, сопоставляющую знаки от Mapillary и данные OSM (что Telenav, напомним, делает автоматически) и улучшали нашу карту — только в США, конечно. 13 июня этой карте пришёл конец, хотя все исходники доступны на github. А на следующий день Вирджиния из команды машинного обучения Mapbox раскрыла, что они взяли у Bing снимки StreetSide на 23 американских города, прогнали их через нейросеточки и получили новую интерактивную карту со 184 тысячами распознанных ограничений движения. Их команда картографов медленно продирается через этот набор данных, но от помощи они не откажутся.

Все эти компании распознают знаки на фотографиях, но автоматизируют только это — и, иногда, сопоставление с ограничениями в OpenStreetMap. А внесение в базу геоданных — ни-ни. Отчасти потому, что знаки не соответствуют никаким объектам на карте, они лишь задают свойства для уже существующих дорог. Причём не всегда привязанные к координатам знаков. Сопоставлять знаки и карту непросто, тем более, если с целью карту улучшить.

Другая причина — сообщество OSM не разделяет мнение Филиппа, что автоматическое распознавание — будущее картографии. Лучше в сто раз медленнее, но руками, с тёплыми ламповыми ошибками и чувством удовлетворения от работы, неведомым алгоритму. Фейсбук уже несколько лет пытается переломить это заблуждение — на конференции SotM в Милане через месяц они снова расскажут, как взаимодействуют с сообществом в Таиланде, куда импортируют распознанные нейросетями дороги.

2018   источники

Внезапные панорамы

Месяц назад в репозитории редактора iD неожиданно появился пул-реквест от Джубала Харпстера. В описании он был лаконичен: «интегрирует снимки StreetSide в редактор. На здоровье. —Микрософт». «Но их же нельзя использовать», — сразу ответил Пол Норман.

Мало кто в восточном полушарии знает, что панорамы есть не только у Google, Яндекса и Baidu. Список подобных сервисов в википедии очень длинный, но в разделе всемирного покрытия пока только две компании с проприетарными панорамами. Вторая — это Microsoft Bing. Их StreetSide запущен в 2009 году и покрывает большую часть Соединённых Штатов и крупные города в Великобритании, Франции и Испании. Вы не увидите эти снимки: «Вид с улицы» доступен только жителям городов внутри области покрытия.

Смотрители проекта iD не так въедливы, как у сайта OSM. Брайан просмотрел на эти семь коммитов от Шоны Паради и Лорена Мюллера, нашёл несколько недочётов и то ли помог их исправить, то ли отредактировал код сам — интерфейс гитхаба не дал понять. Так или иначе, неделю назад запрос был принят, и 14 июня выпущена новая версия редактора с панелью StreetSide. Включается она там же, где Mapillary и OpenStreetCam: кнопкой данных карты, справа под кнопкой слоёв.

Что касается лицензии, Пол немного опоздал с заявлением. Как обнаружил Майкл Райхерт, ещё в апреле Микрософт обновил условия использования своих сервисов, явно разрешив подсматривать в StreetSide для уточнения данных. Немцам, впрочем, от этого мало пользы: их соотечественники успешно отразили все попытки Bing Maps отснять их территорию.

Разумеется, разрешение касается не только редактора iD. В том же пул-реквесте Джубал ответил на несколько вопросов насчёт лицензии, подтвердив, что панорамы можно использовать и в настольных редакторах. Несложно найти код модуля для JOSM, на которым последние несколько дней работает Рене Роудс. Полноценной поддержки придётся подождать в обоих редакторах: вон, в модуле для iD уже нашли ошибку при масштабировании снимка.

Как сотрудники Bing Maps напоминают в пресс-релизе, это не первый их подарок сообществу открытых карт. Каждый пользовался снимками Bing для обклацывания домиков и дорог. Из недавнего, год назад они предоставили OpenStreetMap десять миллионов геометрий зданий в 44 штатах Америки вместе с высотами, которые нарисовали самостоятельно по детальным снимкам и ЦМР. Приятно, что Микрософт уже много лет не отворачивается от открытых сообществ. Спасибо им.

2018   id   источники
Ранее Ctrl + ↓