#每日一书#
今天是开始使用即刻,4个月的节点,也是连续每天写每日一书4个月的节点。一年的计划已经去了三分之一,当然还会继续。 每日一书的笔记目录在bookflow上,链接:bookflow.app。
后面笔记中,将会多写一些个人感受和收获。内容其实大家看目录,前言和第一章,看看评分就知道如何选了。
9.18 深度学习视频理解
深度学习视频理解
这本书入手还没满一年,主要是为了想学习学习视频理解相关的模型。这本书呢,主要就是介绍各种模型,适合研究者读读。
书中开始是回顾了经典的网络结构,基本的CNN结构都有介绍到,还介绍了像RNN,LSTM和GRU,然后就是分成章节来介绍模型了。
- 基于2D卷积的动作识别
- 基于3D卷积的动作识别
- 时序动作定位
- 视频Embedding
我就的背景来讲,因为Embedding在NLP中也有,所以只有这一个章节比较熟悉一点,像动作识别和动作定位都是新知识,还是需要在实际的任务中才能真正去理解这些东西。
以前我写过一篇YouTube 视频理解的文章,链接在下面:
pxiaoer.blog
视频理解的应用现在算是比较多,各种短视频,直播的推荐,自动审核,在很多场景都有使用,在这个视频时代,会有越来越的落地应用。后面感觉多模态的模型会越来越多,看来卷不起了,只能了解了解。
今天是开始使用即刻,4个月的节点,也是连续每天写每日一书4个月的节点。一年的计划已经去了三分之一,当然还会继续。 每日一书的笔记目录在bookflow上,链接:bookflow.app。
后面笔记中,将会多写一些个人感受和收获。内容其实大家看目录,前言和第一章,看看评分就知道如何选了。
9.18 深度学习视频理解
深度学习视频理解
这本书入手还没满一年,主要是为了想学习学习视频理解相关的模型。这本书呢,主要就是介绍各种模型,适合研究者读读。
书中开始是回顾了经典的网络结构,基本的CNN结构都有介绍到,还介绍了像RNN,LSTM和GRU,然后就是分成章节来介绍模型了。
- 基于2D卷积的动作识别
- 基于3D卷积的动作识别
- 时序动作定位
- 视频Embedding
我就的背景来讲,因为Embedding在NLP中也有,所以只有这一个章节比较熟悉一点,像动作识别和动作定位都是新知识,还是需要在实际的任务中才能真正去理解这些东西。
以前我写过一篇YouTube 视频理解的文章,链接在下面:
pxiaoer.blog
视频理解的应用现在算是比较多,各种短视频,直播的推荐,自动审核,在很多场景都有使用,在这个视频时代,会有越来越的落地应用。后面感觉多模态的模型会越来越多,看来卷不起了,只能了解了解。