MOOC视频字幕提取在此,快别抄笔记啦!

懒人技术贴(*゜ー゜*)

鉴于很多读者没有代码功底,而且为了一门课的笔记,而去学习一门新代码语言从时间效率上讲很不划算。因此将其改造为简明易懂好操作、无门槛字幕提取+文档删除多余字符+省纸排版的方法。


* 无需使用python或任何代码语言 !

【由于将字幕提取完毕,打印出来之前会应用word消除数字字符,因此比较适用于文科笔记】~

话不多说,马上开始ψ(`?′)ψ


一、中国大学MOOC 课字幕提取

1.打开你所要下载字幕的MOOC视频,例如
https://www.icourse163.org/learn/BNU-1001563013?tid=1450339461#/learn/announce

2. 于所在页面按F12键(或者WIN+F12),然后点击network。

3.接着按ctrl+F会出来一个Search搜索框,按(WIN+)F5刷新该页面(也可以点击浏览器的刷新按钮)

接下来右侧时间轴会刷新,等它刷新完毕

4. 在搜索框中输入:downloadVideoSrt.htm,按回车键进行搜索。

右下角是当前页面的刷新时间

5.点击搜索到的链接,右边会显示一条黄色代码。

这个过程可能需要你调整一下侧边宽度

复制代码中url后的地址到浏览器中,下载该视频的字幕文件,一般为txt文件。

选中地址,右键【直接跳转】

6. 字幕文件默认命名videoSrt。

改名后的结果如下~

至此,字幕已经提取完毕,但是txt文件中还保有字幕的时间轴信息,接下来我们坚持住,最后耐心去word里面几步轻松删除~


二、消除多余字符

1.打开txt文件,ctrl+A全选。

2.新建WORD,准备好分类标题。

由于稍后会消除所有【数字】,因此数字标题改用汉字。

3.点击【开始】右侧的【查找替换】,找到如下图的【特殊格式】

选择【任意数字】,随后开始清除数字。

清除成果

但是还有许多不必要的标点符 ,如下图左下角、右下角的黄标所示。

4.在【查找内容】框格 输入“[:,->]”(还想替换哪些符 ,一并填入“[ ]”)

随后,勾选【高级搜索】下的【使用通配符】,点击【全部替换】即可。

5.将页面布局的【分栏】选为【三栏】(节约打印的纸张ˋ( ° ▽、° ) )

剩下的工作就是清除之前被时间轴信息占用的空行位置。

如果是WPS用户,选择【文字助手】中的【消除空行】,完成~

* 用word消除多余字符相较于python的唯一BUG是:年份等等数字也没了,只能听课的时候手动添加。


好惹,接下来大家自行打印、装订成册就OK辣ˋ( ° ▽、° )

看在转行中文专业的前程序媛的份上大家给个赞叭!(算我ball ball你们(●’?’●))

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年3月7日
下一篇 2020年3月7日

相关推荐