Google Chrome 阅读器翻开樱花动漫,然后按F12
其他阅读器也同理,都是能够的
红框处右键 copy 复造 那里手头上便利,我就随意翻开了一个QQ对话,粘贴,然后就看到有一个网址
蓝色的 vid=******.mp4 就是那个了 复造下来(不包罗"vid="),粘贴到阅读器上,就能够本身下载了
若是不会编程的话 就需要如许一个一个 会比力费事
会爬虫的就很快很简单的,找到特定位置下的关键词“vid”和“mp4”就能够了
==========================================
弥补一点,上面是针对PC端的,安卓端良多阅读器都有自带下载功用,我用的是小米的,小米阅读器翻开视频,在右下角就能间接下载,苹果的手机没有,不清晰
==========================================
于10月19日弥补:其实爬虫用Python更适宜,但是工做原因,结业后不断都在用Matlab 没用Python 根本都忘记了。Python爬虫思绪与Matlab同理,速度比起Matlab也要更快
就详细介绍一下我那边用matlab的思绪
第一步:樱花动漫播放界面 右键 查看源代码(那一步发现间接源代码,并没有我们想要的下载地址)
第二步:查原因,找位置,在F12 Elements里面临应,我是按照关键头<player>去搜刮的,间接就能搜刮到
跨域毗连是以“/playdata/”开头的,不出不测的话,那个是独一值,不消考虑太多。
第三步:点击毗连,发现网页目次被主动添加,酿成了“http://www.imomoe.ai/playdata/238/7918.js?579.554”,之后我们主动添加一下就能处理。
那时我们需要的下载地址就在那里面了,而且每部动漫只要一次就能够,其余的毗连都已经在那里面了,能够看到几个gss/quan(那里的quan是备用毗连)呈现的次数就是有几集。筹办步调就完成了,很快也很便利
接下来就是Matlab中的代码,(用正则会快良多,然而我脑瓜子嗡嗡的不太友好2333,就以2次头尾判断来截取中间值了。希望大佬们勿喷)
-----------------------起头--------------------
clc,clear,tic %清空并起头计时
url = http://www.imomoe.ai/player/1671-0-0.html; %设置网页链接 随意一个播放界面的毗连就能够 不消特意对应集数
str=urlread(url); %读取网页的源代码
num=strfind(str,/playdata/); %在源代码中找到“/playdata/”关键词位置
str(1:num-1)=[]; %掐头
num=strfind(str,>); %在源代码中找到“>”关键词位置
str(num(1)-1:length(str))=[]; %去尾
url2=[http://www.imomoe.ai str]; %构成准确的跨域地址 (以上五行能够用正则表达式一步到位)
str2=urlread(url2); %读取跨域网页的源代码
num_1=strfind(str2,://); %在源代码中找到“://”关键开头位置(不以http/https是因为部门网址没有,仍是以"://"更准一些)
num_2=strfind(str2,$flv); %在源代码中找到“$flv”关键结尾位置(部门视频不是以.mp4结尾的,但必然以"$flv"结尾)
k=0;
for i=0:12 %那里是详细的集数,我测试的是“山田君于7位魔女”一共是13集 ,所以是0-12(都是从0起头计数的)那里不建议主动,因为那里源代码中包罗了备用链接的,有些有,有些没有,有些还不行一个,还有部门是混合形式(如十月新番大贵族),主动判断很容易出错招致漏下或者多下
k=k+1;
download{k,1}=str2(num_1(k)+3:num_2(k)-1);%记录每集的下载毗连
end
download, toc %最初输出所有毗连及总时间,能够间接复造到迅雷批量下载
-----------------------完毕--------------------
运行成果如下:
怎么说呢,比我想象中的要快一些,2秒钟根本就是翻开2个毗连的时间了,计算不到1秒,原来认为是一个毗连一个跨域,没想到一部动漫的所有集数都在一个跨域毗连里面了,让时间节省了良多。
颠末测试大约20部动漫,都能准确获取到毗连,不排除以前的或者小部门动漫不克不及下载,应该没啥大问题了
用其他语言也是一样的思绪,完全能够本身做一个主动化软件。
就是有2点需要留意一下
1、我那边没有以https做为开头,因为有些毗连是http,长度纷歧样需要判断,代码又会多个几行(正则就没有那个懊恼了),获取到gss/quan后面的毗连对了,再在前面加https的话,对http是没有影响的
2、和第一个差不多,仍是跨域毗连中的问题,获取集数的时候,那里不建议主动,因为那里源代码中包罗了备用链接的,有些有,有些没有,有些还不行一个,有些第一个毗连更新到了8集,备用毗连只要3集,还有部门是混合形式(如十月新番大贵族),主动判断很容易招致漏下或者多下
(写的欠好,请列位大佬们多多指点~谢谢~~)