Ivan Begtin

Ivan Begtin
Технологии и стартапы
Подписаться
ОГФ’2020:

«Умные люди занимаются не слежкой, а аналитикой» 28 ноября мы совместно с «Информационной культурой» @infoculture провели экспертную площадку «Право на приватность и открытость» в рамках Общероссийского гражданского форума.

Собрали в текст главные тезисы и экспертные комментарии из дискуссии «Открытость и приватность: дисбаланс между правами граждан и действиями государства в эпоху пандемии коронавируса».

Участники дискуссии поговорили об эффективности слежки государства за гражданами во время пандемии, шагах к доверию по отношению к государству, «вируспруденции», а также попытались ответить на два главных вопроса
- есть ли баланс между интересами государства и общества и, если нет, как его достигнуть.

➡️ Читать на сайте➡️ Смотреть на YouTube

Ivan Begtin
Технологии и стартапы
Подписаться

Архивация сайтов институтов развития
- это уже около 100 гигабайт в сжатом виде и не менее 100 гигабайт ещё осталось. При этом нет 100% гарантии что выгружается всё, потому что в некоторых случаях действуют "поисковые ловушки", это когда при выгрузке сайта есть блоки которые могут выгружаться бесконечно, например, когда установлены ошибочные ссылки или когда есть календарь с бесконечным пролистыванием до скончания времен в прошлом и будущем. Другая объективная проблема в том что многие данные и материалы могут не индексироваться поскольку отдаются через Ajax, закрыты каптчей или поисковой строкой. Поэтому все задачи по фокусированной архивации сводятся к стадиям:- discovery
- идентификация ресурсов для архивации- crawl
- сбор данных через веб-краулер или специфические краулеры для API или соцсетей- storage
- складирование данных для долгосрочного сохранения, обычно с георезервированием- access
- предоставление доступа к архивам через веб-интерфейс или в виде файловых архивов

#archives

Ivan Begtin
Технологии и стартапы
Подписаться

#
9. Экосистема государственной и негосударственной слежки через мобильные устройства и интернет вещей

Пандемия COVID-19 оказалась тем удивительным природным явлением когда следящие за потребителями корпорации big tech и государства выстраивающие инфраструктуру слежки за гражданами нашли веское основание того зачем они это делают.При этом в обществе существуют очень разные мнения о происходящем. От убеждённости в скором появлении полноценного большого брата до мнения что государство и корпорации и так знают о нас столько, что новые знания не добавляют уже новых рисков.В этом тексте я постарался описать экосистему государственной слежки основанной на уже сложившейся слежке за потребителями.

Текст полностью в рассылке https://begtin.substack.com/p/9-

#privacy #surveillance

Ivan Begtin
Технологии и стартапы
Подписаться

Немодерируемые сайты приводят к спаму и рекламе порнографии (с)

Росприроднадзор использует продукт Gitlab для работы с исходным кодом, но в виду кривых настроек портала общедоступная его часть общедоступна не только для просмотра, но и для регистрации. Как следствие, там уже создано около десятка репозиториев состоящих исключительно из спама [1].

Думаю все мы ждали совсем другого открытого кода от Росприроднадзора;
)

P.S. Хочется добавить какую то мораль, но не могу придумать такую.

Ссылки:[1] http://gitlab.rpn.gov.ru/explore/projects

Ivan Begtin
Технологии и стартапы
Подписаться

У Счетной палаты РФ появился официальный телеграм канал @auditgov, обязательно подписывайтесь, читайте, делитесь и не стесняйтесь давать обратную связь о том чего не хватает и что хотелось бы видеть там чаще.

#accountingchamber

Ivan Begtin
Технологии и стартапы
Подписаться

Я регулярно пишу про такой класс инструментов как git для данных и про платформы претендующие стать аналогом Github'а для данных. Пока нет лидера ни в том ни в том, но есть хорошие попытки.

Новый-старый инструмент управлению версионностью данных для задач data science
- это replicate [1] [2] Утилита и библиотека на Python с открытым кодом, единственная фактическая альтернатива dvc [3] если говорить про применение к data science. А если говорить про другие dolt, quilt, noms, hub и sno, то практически все они работают с данными относительно небольшого объёма

Ссылки:[1] https://github.com/replicate/replicate[2] https://replicate.ai/[3] https://github.com/iterative/dvc

#bigdata #data #data-science #data-version-control

Ivan Begtin
Технологии и стартапы
Подписаться
В блоге Airbnb Engineering &

;
Data Science описание их процесса сертификации качества данных [1] любопытное их детальностью и фокусом на многоуровневую проверку: спецификаций, данных и кода. Ссылки:[1] https://medium.com/airbnb-engineering/data-quality-at-airbnb-870d03080469

#data #dataquality

Ivan Begtin
Технологии и стартапы
Подписаться
Поэтому выношу на голосование о том о чём прочитать было бы интереснее.

Под конец года очень много работы с текстами и я уже две недели не делал еженедельную рассылку будучи заваленным этой текстовой работой. Но планы к следующей рассылке уже есть (кстати напоминаю где её можно прочитать и подписаться https://begtin.substack.com ).

Эту тему я приоритетно разберу максимально подробно

Ivan Begtin
Технологии и стартапы
Подписаться
Какие темы поднять в первую очередь в следующих темах рассылки?

anonymous poll Экосистема государственной и негосударственной слежки через мобильные устройства и интернет вещей – 19👍👍👍👍👍👍👍 48%

Форматы, стандарты и протоколы публикации данных – 10👍👍👍👍 25%

Государственные закупки и контракты – 5👍👍 13%

Эволюция порталов данных от каталогов к доставке данных – 3👍 8%

Технические аспекты веб-архивации – 3👍 8%

👥 40 people voted so far.

Ivan Begtin
Технологии и стартапы
Подписаться

Журналисты «Медиазоны» и «Медузы» получили доступ к закрытой базе ИЦК
- Информационного центра по мониторингу ситуации с коронавирусом. В этой базе содержатся сведения о свободных койках, количестве пациентов на аппаратах ИВЛ и о количестве умерших в коронавирусных больницах.

Из данных в этой базе следует, что в официальной статистике Роспотребнадзора данные о смертности в России занижены в два раза.

Подробнее здесь:https://zona.media/article/2020/11/30/itsk-covid

Ivan Begtin
Технологии и стартапы
Подписаться

Хотя я всё время и говорю о том что открытость государственных финансов в России высокая, но она не без "нюансов".

Вот несколько примеров:
1. Не могу нигде найти в удобном формате данные об исполнении федерального бюджета за 2019 год. Закон об исполнении бюджета был принят в 30 сентября 2020 года, утверждён Советом Федерации 7 октября 2020 года [1], но на сайте ЕПБС отсутствует [2] и на сайте Минфина тоже нет. Есть он на сайтах официального опубликования pravo.gov.ru и других справочно-правовых системах, но там только текст из которого ещё надо вычленять таблицы. Хорошо хоть не сканом, но для непытливого ума
- это то ещё испытание.


2. В Республике Татарстан закон об исполнении бюджета данные к закону об исполнении бюджета публикуют без ключевого документа детальной ведомственной структуры расходов [4], а сам закон об исполнении бюджета (не буду даже догадываться почему), но публикуется в виде скана. А если всё таки заглянуть в ведомственную структуру расходов в этом законе, то она будет приведена с детализацией только до 1-го уровня вида расходов, для сравнения, в отчётах Федерального казначейства детализация до 3-го уровня видов расходов, а в отчетах об исполнении бюджета Москвы как минимум до 2-го уровня видов расходов. Каждый уровень даёт возможность конкретизировать то на что пошли деньги. Например без детализации до 3-го уровня невозможно идентифицировать объёмы средств идущие на ИТ (242 вид расходов) в ведомственном разрезе по субъекту федерации.

Ссылки:[1] http://pravo.gov.ru/proxy/ips/?docbody=&
firstDoc=1&
lastDoc=1&
nd=102887899
[2] http://budget.gov.ru/epbs/faces/p/%D0%91%D1%8E%D0%B4%D0%B6%D0%B5%D1%82/%D0%97%D0%B0%D0%BA%D0%BE%D0%BD%20%D0%BE%20%D0%B1%D1%8E%D0%B4%D0%B6%D0%B5%D1%82%D0%B5/%D0%97%D0%B0%D0%BA%D0%BE%D0%BD%20%D0%BE%D0%B1%20%D0%B8%D1%81%D0%BF%D0%BE%D0%BB%D0%BD%D0%B5%D0%BD%D0%B8%D0%B8%20%D0%B1%D1%8E%D0%B4%D0%B6%D0%B5%D1%82%D0%B0?_adf.ctrl-state=1invsu6rd_77&
regionId=45
[3] https://minfin.gov.ru/ru/perfomance/budget/federal_budget/budgeti/2020/[4] https://minfin.tatarstan.ru/godovoy-otchet-ob-ispolnenii-byudzheta.htm?pub_id=2362274[5] https://minfin.tatarstan.ru/godovoy-otchet-ob-ispolnenii-byudzheta.htm?pub_id=2373238

#budget #data #finances

Ivan Begtin
Технологии и стартапы
Подписаться

На сайте MIT Technology Review [1] публикация о том что теперь в Сингапуре отслеживание контактов является обязательным и обзор и сравнение мобильных приложений, их технологий и их прозрачность по странам.

У них же там весьма интересная таблица [2] в которой больше информации чем то что показывается в статье.

P.S. России в списке стран и приложений ещё нет

Ссылки:[1] https://www.technologyreview.com/2020/11/23/1012491/contact-tracing-mandatory-singapore-covid-pandemic/[2] https://docs.google.com/spreadsheets/d/1ATalASO8KtZMx__zJREoOvFh0nmB-sAqJ1-CjVRSCOw/edit#gid=0

#privacy #mobile

Ivan Begtin
Технологии и стартапы
Подписаться

На ОГФ на нашем треке всплыла тема прогнозов, того что нас ждёт с точки зрения открытости и приватности в будущем на фоне эпидемии COVID-
19.

У меня есть свой набор предсказаний на ближайшие 5 лет:
1. Усиление big tech корпораций и их всё большая конкуренция с национальными правительствами.

Пример: мониторинг контактов при COVID-19 в итоге реализован на API Apple и Google и по их правилам.

Почему может произойти: Страны тяжело договариваются между собой, текущие структуры при ООН погрязли в бюрократии, политика безусловно доминирует над кооперацией.

Почему может не произойти: Национальные правительства ощущают эти ограничения и риски, но, по прежнему субъектами своего влияния считают правительства стран где big tech корпорации находятся.


2. Активное внедрение интернета вещей для мониторинга органами власти в странах с наиболее допускающим регулирование

Пример: Сингапур внедряющий браслеты для жителей для мониторинга при COVID-19

Почему может произойти: В отличие от экосистем мобильных устройств платформы для интернета-вещей пока не имеют олигопольного доминирования 2-3 платформ, ускоренное регулирование и введение ограничений может дать национальным правительствам больший контроль

Почему может не произойти: big tech корпорации значительно гибче, мобильнее, быстрее и осознаннее используют пробелы в регулировании и могут взять этот рынок под полный контроль в течение пары лет.


3. Сохранение всех созданных информационных систем и мобильных приложений для слежки во время COVID-19

Почему может произойти: Обоснование инвестиций и продолжение эксплуатации в соответствии с прогнозами новых эпидений (от 3 до 10 лет в ближайшем будущем) и в использовании механизмов социального контроля к легально дискриминируемым группам (отпущенным на поруки, болеющим заразными заболеваниями, находящимся под домашним арестом, подозреваемым в преступлениях и так далее). С высокой вероятностью подготовка общественного мнения начнётся ещё до окончания пандемии COVID-19

Почему это может не произойти: резкое усиление общественной озабоченности слежкой, масштабные, не прекращающиеся утечки персональных данных собранных во время слежки


4. Усиление тренда на саморегулирование алгоритмов искусственного интеллекта и усиление роли корпораций big tech в этой области

Почему это может произойти: текущее регулирование ИИ архаично и не поспевает с развитием технологий, у государственных органов нет экспертов в этой области. Неизбежно появление цифровых центров экспертизы через консорциумы университетов и big tech корпораций которые и будут помогать государственным органам в аудите и проверке алгоритмов

Почему это может не произойти: усиление регуляторного давления, рост недоверия к корпорациям big tech

#privacy #foresight #ai

Ivan Begtin
Технологии и стартапы
Подписаться

📌Прямо сейчас на нашей площадке «Право на приватность и открытость» дискуссия об ответственных алгоритмах.

Участники постараются выяснить и ответить на вопрос, как открытость информации способна повлиять на легитимность технологий в обществе.

Спикеры секции:▪️Елена Брызгалина, заведующая кафедрой философии образования философского факультета МГУ, член локального этического комитета НЦЗД Минздрава РФ;
▪️Саркис Дарбинян, глава юридической практики РосКомСвободы и управляющий партнёр Digital Rights Center;
▪️Иван Бегтин, директор АНО «Инфокультура»;
▪️Алексей Раевский, генеральный директор Zecurion;
▪️Андрей Устюжанин, заведующий научно-учебной лабораторией LAMBDA Факультета компьютерных наук НИУ ВШЭ.

Модератор:▪️Василий Буров, соучредитель АНО «Инфокультура», советник директора МИЭМ НИУ ВШЭ.

❗️Подключайтесь к трансляции и задавайте свои вопросы спикерам!

Ivan Begtin
Технологии и стартапы
Подписаться

Поговорили с Иваном Бегтиным, апостолом открытых данных, о заявленной административной реформе им. премьера Мишустина, о так называемых "институтах развития", лукавстве бюрократической статистики, сходстве и различии между Сколково и Сириусом, новой монополизации и иных увлекательных сторонах госуправления. Граждане комментирующие жалуются на ведущего, который мешает, и на частые рекламные паузы (не на моем канале, а в радиоэфире). Но, надо сказать, комментаторы хронически ругают любых ведущих, кроме всенародного любимца Максима Курникова, а этот ведущий зато после каждой паузы так вдохновенно рассказывает о подвигах Екатерины Енгалычевой в Мосгордуме, как будто у них взаимный договор о продвижении подписан (на самом деле нет). В общем, вышло живенько, мне лично удалось узнать кое-что новое о повадках бюрократии, её защитной окраске и меняющихся пищевых привычках.

Рейтинг авторов

  • "Записки Дизайнера" (про дизайн и только про него 157 157 157
  • (Не) только немецкий 157 157 157
  • #анямастерконтента 157 157 157
  • #Фудтех 157 157 157
  • 10 идей и трендов дня 157 157 157
Показать весь рейтинг
Загрузка ...