old_ufo: (Default)
Напишу-ка я по горячим следам отчет о EECVC 2017.

Прошлая конференция была очень хорошей и задала уровень, который не так просто побить. Отличное место, неплохие, в большинстве своем, доклады.
Тем не менее, планку в этом году подняли еще выше, даже опасаюсь ехать в 18-м, чтобы не испортить.

Давайте по порядку.
Город проведения: та же Одесса. Интерсити едет 7 часов, что утомительно, но ок. Правда, приежает в полночь, что слегка не ок, но да ладно.
Место проведения: другой коворкинг: Терминал 42. Заведение хорошее, хотя прошлое было чуть уютнее.
Время: Одесский кинофестиваль. Квартиру было найти не так, чтобы просто, но и не так, чтобы нереально. Зато можно пойти посмотреть фильмы.

Доклады.
Доклады были круты. Если в прошлом году доклад Джеймса про BoW Retrieval был сияющей недосягаемой вершиной, то в этом году только немного выделялся. И не потому, что уровень Джимми упал - это остальные сильно подтянулись.

Саша Шеховцов рассказал о современных (сеточных) optical flow алгоритмах. Немного перенасыщенно для тех, кто не в теме, но в целом все равно понятно. Ну и state-of-art от автора, все дела (раз)

Tolga Birdal из Siemens/TU Munich  рассказал о 3D реконструкции из лазерного сканера при наличии CAD-модели - для оценки точности изготовления. Круто и интересно - особенно учитывая, что такие темы редко встречаются как на CVPR, так и на украинских индустриальных конференциях. Снова стейт-оф-арт и снова от автора метода (два).

Sergii Kharagorgiev рассказал и показал продукт своей компании (https://www.starship.xyz/) : автономных роботах для решения проблемы последней мили. Тут вроде и реклама себя, и постановка задачи (бизнес и технической), и рассказ о том, как у них работает автономная навигация. Достаточно подробно, чтобы было интересно, но недостаточно деталей, чтобы быстро скопировать. ИМХО, отличный образец технического доклада от представителя компании.

Дальше был выпускник КПИшного физтеха и студент М.И. Шлезингера Валерий Крыгин с докладом о 3д реконструкции лица по одному изображению. С одной стороны, доклад был заметно слабее, чем все остальные. С другой - для украинской магистерской работы, это ого-го какой уровень. Ну и то, что доклад слабее, но все-таки сравним с другими, говорит о многом.

Евгений Горовий из IT-Jim рассказывал об обработке и распознавании радарных (SAR) снимков. Интересный доклад - выжимка из серии статей автора и тоже стейт-оф-арт в какой-то специфической области.

После обеда Виктор Сдобников презентовал статью коллег - Евгения Водолазского и М.И. Шлезингера . Непонятно, правда, почему презентовал Виктор, ведь автор статьи на конференции был и даже рассказывал во второй половине доклада. Ну да ладно. Доклад был интересный, но с несколькими проблемами. Во-первых, мало кто его понял, увы. Как минимум потому, что такие вещи лучше воспринимать не с голоса, а вдумчиво читая статью. Во-вторых, результаты хороши, но для случая небольшого трейнинг сета. Чем больше тренировочных данных, тем меньше разница между "правильной" и "неправильной" стратегией принятия решения. Ну и, наконец, метод оптизации для представленной целевой функции не за всё время мира пока отсутствует :)

Джимми рассказал о детектировании повторяющихся паттернов и какие прикольные штуки с ними можно делать - его текущая работа + прошлые статьи (+1 стейт-оф-арт)

Ну и Andrew Rabinovich, директор по исследованиям из Magic Leap (тех, которые привлекли $1.5B и оцениваются в 8 ) Его доклад "Then, Now, Tomorrow: Neural Networks for Computer Vision" был обзором нейросетей "с начала времен". Несмотря на то, что я ожидал как минимум части в стиле "ваш кэп", но таковый оказался весь доклад. Визионерской (на которую я надеялся), пусти и общей, части, увы, не было. Еще он заявил, что компьютер вижн будет решен к 2020 году, с чем присутствующие не согласились, было весело :)

Ну да свою функцию он выполнил - просто приехать на конференцию. Теперь можно хвастаться, что в Украине есть конференциия, где выступает менеджмент Magic Leap и все-такое.


Подведем итоги. В отличие от прошлой EECVC (и других украинских конференций, где я был), неинтересных докладов не было вообще. Более того, на половине докладов были показаны алгоритмы с мировым state-of-art в своей области. Причем не просто пересказаны кем-то, а рассказаны самими авторами.

Организация в технических моментах - отличная.

Итого. Я ничуть не жалею, что вписывался за конференцию, а совсем наоборот. Пусть таких конференций будет больше в Украине. Точнее, не так. Пусть будет больше конференций в AI/CV/ML/... такого уровня, но со своей направленностью: бизнес, академической, и т.д.
old_ufo: (old_ufo)
Народ, така річ.

Буває, що до мене звертаються знайомі із питанням "а чи хтось не шукає людину в сферу ML & CV? Я от думаю змінити роботу".

Буває, що до мене звертаються інші знайомі із питанням "а ти не знаєш прикольну людину, що в CV або ML шарила? Тут місце є".

Проблема в тому, що такі штуки рознесені у часі і я, звичайно, кого можу, з ким можу контачу, але часто тупо не пригадую :(

Вирішив завести собі дві таблички в гугл-екселі, таке собі кадрове агенство від [livejournal.com profile] old_ufo.
До чого це я: якщо ви шукаєте когось, або роботу - пишіть у приват, я собі запишу, щоб не забути. Приватність гарантується, вот ето всьо. Пост не має строку давнини.
old_ufo: (old_ufo)

Pytyhon OpenCV FLANN may crash with message:

"OpenCV Error: Assertion failed (The data should normally be NULL!) in allocate, file /home/old-ufo/opencv/modules/python/src2/cv2.cpp, line 163
Traceback (most recent call last):
File "kd.py", line 120, in <module>
flann.add( [ descs ] )
cv2.error: /home/old-ufo/opencv/modules/python/src2/cv2.cpp:163: error: (-215) The data should normally be NULL! in function allocate"
old_ufo: (фотография)

Честно сказать, я не фанат "отраслевых" конференций. Т.е. пару раз съездить можно и нужно, а дальше уже степень полезности убывает экспоненциально, если не любить тусоваться.
Проще поговорить со спикерами лично, так и обсудить можно больше. Что до нетворкинга, то, по большому счету, ездят-то одни и те же люди, смысл поcле первых пары раз?

EECVC подкупила тем, что главной заявленной целью было "собрать ukraininan computer vision комьюнити", была исключительно по приглашениям, чтобы отсеять левых "профессиональных посетителей и спикеров конференций". Ну что ж, давайте попробуем и посмотрим, что получится, как говорил император Грегор. Поэтому регистрация была бесплатной, но организаторы отсеивали тех, кто по их мнению, не имел отношения к CV.

upd2.: Выложили слайды и видео докладов.

upd.: Виталий говорит, что целью было собрать восточно-европейское комьюнити, а не чисто украинское и что 20 из 120 человек были не из Украины. Частично принимается, но нет, это была все же украинская тусовка, сорри. А вот то, что язык конференции был английским, и все прошло отлично - это да, я упустил в отчете.

Получилось неплохо )

old_ufo: (old_ufo)

Обновление в списке computer vision публикаций из пост-СССР.

Снова наши старые знакомые из СколТеха :) Всё, больше никого.
CVPR2016



Статья

Авторы

Организация
Fast ConvNets Using Group-wise Brain Damage Vadim Lebedev, Victor Lempitsky

Skoltech, Yandex

Efficient Indexing of Billion-Scale Datasets of Deep Descriptors. Artem Babenko, Victor Lempitsky

Skoltech, Yandex

old_ufo: (old_ufo)
Пані та панове (особливо, студенти та аспіранти), маю до вас пропозицію.
Якщо ви хочете зробити публикацію на крутій конференції, але не знаєте, над чим саме працювати, не маєте наукового керівника або не маєте грошей на політ на саму конференцію, то ми вирішимо ці проблеми :)

Що я роблю зі своєї сторони:

  • надаю тему та здійснюю наукове керівництво.

  • у разі прийняття статті на топ-конферецію (список трохи згодом), ви їдете презентувати роботу. Реєстрація, дорога, перебування оплачується Szkocka Research Group.

  • допомагаю із доступом на (платні) статті, необхідні для роботи

Ми разом:

  • працюємо над дослідженням та статею.

Ви:

  • маєте бажання і час займатись наукою

  • робите експеримент, статтю та презентуєте її.

Умови співробітництва:

  • Код, що народився під час роботи, публікується під MIT\BSD ліцензією, щоб вся спільнота могла користуватися плодами роботи.

  • Однією з ваших афіліацій указується Szkocka Research Group, Ukraine.

Теми (можете такоє запропонувати свою, обговоримо):

  • Mutltispectal image search by pseudo-Siamese nets (для супутникових знімків\карт)

  • Unsupervised feature learning by learning to noise and de-noise

Хто зацікавився - пишіть в приват, або в коментарі.
P.S. Так, це пілотний запуск Szkocka Research.
old_ufo: (old_ufo)

Обновление в списке computer vision публикаций из пост-СССР.

А именно, наши старые знакомые из Яндекса :) Всё, больше никого.
ICCV 2015




Статья

Авторы

Организация
Aggregating local deep features for image retrieval Artem Babenko, Victor Lempitsky

Skoltech, Yandex, МФТИ

old_ufo: (old_ufo)

После соревнования по распознаванию планктона и покупки видеокарты, я замахнулся на ImageNet 2015.
Одним из прошлых выводов было "команда - это круто", ну я и попробовал такую собрать.

Вначале все было хорошо, но вскоре один за другим начали появляться дедлайны, проекты и прочее, так что я в итоге остался один. Итого вывод первый:

1) Важно не (с)только количество ресурсов, а их определенность и предсказуемость.
Если знать с самого начала, на что можно рассчитывать, а на что нет, то можно успеть больше и лучше - тупо концентрируясь и отсекая лишнее.

Дедлайны появились и у меня тоже, в результате на имаджнет наложились аж три других дедлайна - две статьи и отправка нашего рабочего приложения в эппл-стор. Отсюда вывод второй:

2) Проблема не (с)только в нехватке времени, а в нехватки времени эффективного. Точнее - умственной энергии.

Посему на локализацию я забил (вернее, попробовал поздно, вышла хрень) и отправил результаты практически только потому, что было бы неудобно перед NVIDIA и IBM, которые предоставили сервер для вычислений. Гонять его месяц и ничего не отправить, как-то совсем тупо.

Мини-вывод: K80 - полная фигня. Нет, 4 ядра по 12 Гб оперативы это, конечно, круто. Но эти 4 ядра вместе тренируют сетку МЕДЛЕННЕЕ, чем Titan X. Из-за неучета этого, кстати, я не успел получить предсказания для полноразмерных картинок и результат минимум на один абсолютный процент хуже, чем должен был быть.

3) ImageNet 2015 - как чемпионат мира, готовиться к нему и проверять идеи нужно весь год. Группой.

А в отведенные два месяца - просто натренировать свой алгоритм на представленных данных.
Почему? Потому что ждать проверки одной гипотезы 2 недели - увольте. Тогда нужно иметь парк серверов, чтобы 2 недели ждать проверки сотни гипотез. Правда, чтобы придумать сотню гипотез, нужны выспавшиеся мозги, см. пункт 2.
Чтобы вы оценили уровень оснащенности, которым оперирует Майкрософт для проверки алгоритмов на Иманджнет уровне, цитата из сегодняшней их статьи:

The resulting architecture was implemented in DMLC as well, and we trained the network for 1000 epochs using (mini-) batches composed of 100.000 images (which was feasible due to distribution of the computational load to a cluster of 52 CPUs and 12 hosts, where each host is equipped with a NVIDIA Tesla K40 GPU).

Пятьдесят два проца и двенадцать блоков по 4 видеокарты.

Тем не менее, не жалею, что попробовал - получил ценный опыт по сбору людей, тайм-менеджменту, и, если все будет хорошо, будет статья по нейросеткам.

old_ufo: (old_ufo)
Чтобы не быть голословным по поводу качества нашей науки я написал простенький скрипт и составил список публикаций из пост-СССР учреждений на топовых конференциях по компьютерному зрению. Начнем с этого года.
Есть статьи c CVPR и BMVC, ICCV будет чуть позже, а ECCV проводится только по четным годам.

Методика очень проста - черновой список авторов я получаю с помощью скрипта, а потом гуглю, кто откуда. Учитываются только те, чьи организации находятся на территории бывшего СССР. Скажем, Александр Шеховцов - выпускник КНУ им. Шевченка - в список не попал, потому как сейчас работает и публикуется из TU Graz.

Итак, поехали

CVPR2016





Статья



Авторы



Организация
Fast ConvNets Using Group-wise Brain Damage Vadim Lebedev, Victor Lempitsky

Skoltech, Yandex

Efficient Indexing of Billion-Scale Datasets of Deep Descriptors. Artem Babenko, Victor Lempitsky

Skoltech, Yandex


BMVC 2015


Статья


Авторы


Организация
Perceptually Motivated Benchmark for Video Matting Mikhail Erofeev, Yury Gitman, Alexey Fedorov, Dmitriy Vatolin and Jue Wang http://graphics.cs.msu.ru/ МГУ
Camera Pose and Focal Length Estimation Using Regularized Distance Constraints Alexander Vakhitov, Katerina Kanaeva and Lev Gurevich http://se.math.spbu.ru/ СПбГУ

CVPR 2015



Статья


Авторы


Организация
Tree Quantization for Large-Scale Similarity Search and Classification Artem Babenko, Victor Lempitsky Skoltech, Yandex, ВШЭ
Learning To Look Up: Realtime Monocular Gaze Correction Using Machine Learning Daniil Kononenko, Victor Lempitsky Skoltech


ICCV 2015



Статья


Авторы


Организация
Aggregating local deep features for image retrieval Artem Babenko, Victor Lempitsky

Skoltech, Yandex, МФТИ

Негусто, правда? Буду обновлять по мере прохождения конференций.

P.S. Качайте скрипт и добавляйте данные по machine learning и другим областям :)

old_ufo: (old_ufo)
Про собственно Бостон будет еще поста два или три, а сейчас о том, зачем Енотик ездил в Бостон.


Итак, CVPR, топовая конференция по компьютерному зрению. Бюджет по минимальным прикидкам (стоимость регистрации + спонсорства - больше $1,5 млн).

2260 зарегистрированных участников, 602 статьи (28,4% от присланных работа), 71 устная презентация (3,3% от присланных).

Собственно тут я понял, как должна выглядеть научная конференция и какие у нее цели.

Конференция и мой доклад )
old_ufo: (old_ufo)

Пока GPU-шка считает очередной эксперимент, а идей в голове не так, чтобы сильно много, напишу-ка пост.
За последние пару лет довольно много вещей изменились, причем в организационном и гуманитарном смысле даже больше, чем в собственно техническом.

Во-первых, раньше подписка на статьи с IEEE была практически необходима для нормальной работы (иначе - разве что подбирать крохи с citeseer), а на Springer и Elsevier - очень желательна. Теперь же IEEE только желательна, а со Springer и Elsevier можно изредка купить то, что надо (последний раз было надо месяца два назад). 99% современных статей можно найти в виде препринта или на сайте авторов, или на arXiv.
Что радует еще больше - если раньше препринты статей, отправленных на CVPR/ECCV/NIPS/... появлялись примерно во время конференции, то сейчас немалая их часть - почти сразу после дедлайна подачи. Что ускоряет скорость обмен информацией и идеями где-то на 6-9 месяцев.

Во-вторых, гегемония азиатских фамилий переходит и в высшую лигу. Причем если раньше это был, скажем, Andrew Ng или красавица Fei-Fei Li, т.е. профессора американских университетов азиатского присхождения, то теперь и университеты сингапурские или там MS Research Asia.

На этом фоне забавно вспоминать одну дискуссию с эсперансистом.

Потому что всё более-менее ценное оперативно переводится на другие языки, и нет необходимости зубрить английский, чтобы с этим ознакомиться. Конечно, возникает определённая задержка между появлением информации и её переводом, и знающий английский специалист имеет преимущество.

Только за ноябрь в нашей рабочей базе научных статей добавилось 43 штуки. Не все из них, конечно, используются, но пара - так точно.  Давайте, расскажите мне, как ребята из Беркли или Стэнфорда будут учить эсперанто или кто-то будет переводить сборник статей ECCV-2014 на русский.

Кстати, о русском. Из пост-союза на ECCV-2014 аж одна статья - от Яндекса. Яндекс - он, вообще, привык публиковаться на нормальных конференциях и это единственное исключение. Интересно, кстати, что делает "Сколтех" - правда что-то разрабатывает, или дает деньги на исследования Яндексовцам.


В-третьих, этот год и, видимо, следующий, CV-ученые будут продолжать играть в "возьми технологию из классического CV, прикрути к deep learning CNN, получи новый state-of-art и опубликуй". Например, Fisher vectors и VLAD, которые вроде как получили отставку в 2012, внезапно воскресли и намекают.
Если кто-то хочет присоединиться к забаве, помните, что рвать низковисящие яблоки проще всего тем, кто давно в саду. Так что халявы, скорее всего, не будет - лучше придумывать что-то свое.

И да, помнится, [livejournal.com profile] tassadar_ha год назад писал, что мой любимый Оксфорд не дотягивает (строго говоря, кафедра чуть другая, но не суть). Ну-ну.
Это просто ребята тогда не пробовали играться с технологией. На фундаментальные прорывы, конечно, я сделаю ставку скорее на Хинтона или Бенджио, но старая школа computer vision вполне обучаема новым трюкам, а уж старые она не забудет. Но это так, к слову.

Завершу пост тем, что меня все происходящее в этой области очень радует. Технологии, статьи и инструменты доступны практически всем, даже программировать уметь не обязательно. Обязательно иметь идеи и знания, почти полная меритократия.
Добро пожаловать в отправляющийся поезд. Он точно едет в будущее и оно, вроде бы, светлое.

old_ufo: (old_ufo)

На machinelearning.ru висит объявление о computer vision конкурсе с призовым фондом в $3700 (первому месту 2/3, второму - 1/3). Внешне звучит неплохо. Но за эти деньги авторы хотят(далее выдержка из правил):

11. Интеллектуальные права
a) исключительные права на ПО подлежат передаче Победителем Конкурса Организатору
Конкурса на условиях отчуждения (в полном объеме)
;

9.2. Участники Конкурса обязуются:
...
f) участвовать по требованию Организатора Конкурса в фотосессиях, видеосъемках,
интервьюировании и иных мероприятиях, посвященных Конкурсу и участию в нем
Участников Конкурса;


9.3. Ответственность Участников Конкурса:
c) Участник Конкурса обязуется возместить любые убытки, возникшие у Организатора
Конкурса и/или иных лиц вследствие нарушений соответствующим Участником
Конкурса настоящих Правил, прав третьих лиц и/или действующего законодательства
Российской Федерации.
При этом:

10.3. Организатор Конкурса не несет ответственность за:
e) любые расходы, убытки, возникшие у Участника Конкурса вследствие участия в
Конкурсе и/или получения Награды, полученных от Организатора Конкурса/его
представителей по заданию/поручению Организатора Конкурса в соответствии с
настоящими Правилами.


Для сравнения, правила идущего сейчас конкурса на kaggle.com на $5000 :
Открыть свои исходники. Дать опен-сорсную или неэксклюзивную лицензию проводитору, дабы он мог проверить работоспособность. Организаторы не несут ответственности за убытки участников, но и про ответственность участников кроме интеллектуального воровства тоже ничего нет). Под спойлером выдержки на английском.

CODE SHARING

Participants are prohibited from privately sharing source or executable code developed in connection with or based upon the Data, and any such sharing is a breach of these Competition Rules and may result in disqualification.

Participants are permitted to publicly share source or executable code developed in connection with or based upon the Data, or otherwise relevant to the Competition, provided that such sharing does not violate the intellectual property rights of any third party. By so sharing, the sharing Participant is thereby deemed to have licensed the shared code under the MIT License (an open source software license commonly described at opensource.org).

OPEN-SOURCE CODE
A Submission will be ineligible to win a prize if it was developed using code containing or depending on software licensed under an open source license:

* other than an Open Source Initiative-approved license (see ); or
* an open source license that prohibits commercial use.

PUBLIC COMPETITIONS: NON-EXCLUSIVE LICENSE
RESEARCH COMPETITIONS: OPEN SOURCE LICENSE
RECRUITING COMPETITION SUBMISSION LICENSE GRANT

Profile

old_ufo: (Default)
old_ufo

July 2017

S M T W T F S
      1
2345678
9101112131415
16 171819202122
23242526272829
3031     

Syndicate

RSS Atom

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 25th, 2017 06:03 am
Powered by Dreamwidth Studios