Недавно осознал одну важную вещь в машинном зрении, да и вообще в анализе данных. Для решения какой-либо проблемы в зрении, на самом деле, всегда требуется решить две важные задачи: построить модель и придумать метод как её обсчитывать. Притом эти две задачи очень разные по своей сути и, зачастую, люди умеющие хорошо решать одну не слишком сильны в другой. Притом, как ни крути, а одно без другого вообще не имеет смысла. Очень крутая и навороченная модель с 30 тысячеми параметров может и объяснит все ваши данные, но на кой чёрт она вам нужна, если вы не можете придумать метода как эти параметры найти? Бывает когда даже не ясно как эту модель в память запихнуть и т.п. Но и метод без модели полное фуфло. Ну вот возьмём, например graph cuts. Метод хороший, позволяет мощно оптимизировать семейство дискретных функционалов. Но если почитать статьи с его применением, то можно найти полный спектр от прорывов до полной лажи.
Интересный вопрос "что важнее?" Йоахим считает, что модель. Точнее, он говорит что все главные прорывы в vision были сделаны не с помощью крутых методов, а с помощью эллегантных моделей. Мне кажется что он прав. Для хорошего решения наличие хорошей модели необходимо (хоть и не достаточно), но наличие хорошего метода обсчёта лишь желательно (необходим хоть какой-то). Более того, именно такие работы имеют наибольший резонанс - после того как модель представлена, набегают толпы китайцев и начинают докручивать метод.
Подписаться на:
Комментарии к сообщению (Atom)
Комментариев нет:
Отправить комментарий