分类目录：移动互联

困扰了快1个月的家用宽带网络卡顿问题-Linux病毒实战手记
HomeServer 2024升级计划
HomeServer直播、监控方案实践
HomeServer安装在线Office：Docker安装最新精简版OnlyOffice
开源好用的电子书管理服务Talebook（Calibre网络版）安装使用指南
Home NAS 音乐服务解决方案
自制一个动态域名解析系统
HomeNAS IP变化规律
分享一个实时抓取IT相关博客和新闻的业务
分享一个追最新外语电影的RSS

困扰了快1个月的家用宽带网络卡顿问题-Linux病毒实战手记

作者：童燕群 | 发布日期：四月 21, 2024 | 阅读次数（184） | 评论

最近一段时间家里领导反馈网络经常慢，之前还没太在意，上周反馈给电信，电信小哥直接给换了光猫。观察了几天，仍然间歇性的卡顿。尝试换路由器，换光猫拨号，都没有彻底解决。今天发现homenas流量异常，经常跑出大于电信宽带规格的带宽，家里宽带规格是300Mb的，上行更是只有50Mb的，怎么能跑出1000Mb带宽的数据量，很像是局域网的访问行为，这个带宽看起来很像家用磁盘的规格。压根没往外网流量上面想。查各种监控，都只有带宽和流出数据量的统计，找不到哪个进程或者业务。尝试atop，ntop，iftop，netdata，nethogs各种监控，都看不到流量哪里来的，更别说netstat了。最后只能tcpdump持续抓包，找到了一些线索。

大量从本机发出去的syn包，syn flood攻击，只是我的nas是攻击方，被拿来做“肉鸡”了。只发出了syn包，netstat看不到连接，还是我敲命令的时候，攻击已经停了，应该是前者，攻击的时候，登录在控制台界面也看不到连接。发现所有的网络统计工具都不显示只发了syn包的连接。syn攻击在工作中经常听到，但是很少有机会去实地解决，前端的防护设备帮挡住了，没想到在家用设备上面遇到了。

进一步找系统日志，有提示被攻击，应该是对端回应syn的包被系统识别为攻击请求直接拒绝了。

第一天就先查到这里了，担心NAS上面的数据被破坏，也先保家里的网络，关机收工。留下了几个疑点：
1，能跑出80MB上行带宽，远大于5MB，说明电信在这种攻击报文的带宽统计有缺陷，拦不住。当然syn包是否都出了光猫，发到了目标端，还是存疑的；
2，操作系统能拦截外面进来的攻击行为，不知道有没有拦截本机外发攻击包的行为；
3，根因应该是nas上面docker滥装，没有考证安全性，被留了后门，或者某个软件有已知的漏洞，被利用了。空了再找吧。

第二天上午，小心翼翼的开启NAS，继续分析头一天的抓包和系统日志。

试图从日志搜索攻击目标端的IP地址是什么时候注入的，无果。然后逐行分析日志，将重复的UFW日志过滤掉。可以发现有两条Cron的日志一直在打印：

这条 /.mod的日志特别显眼，之前就看到过这个日志，没有联想到系统的异常流量，因此觉得就是系统的例行任务。现在仔细看这个文件，是放在根目录的，之前没去分析过这条记录的含义，没注意放在根目录。一般可执行的命令怎么会放在根目录？赶紧去根目录找这个文件，使用ls命令，居然是返回的空，没见过这种，大概率是修改了文件属性之类的，继续使用stat命令，就发现异常了。文件是3月30号创建的。考虑这个文件每分钟都在执行，那我手动执行一次也无妨。使用strace跟踪执行过程，发现这个可执行文件会去打开/usr/lib/libgdi.so.0.8.2这个文件，然后看起来是直接执行这个文件。这是so文件，怎么会可执行呢？病毒无疑了。后面去打开这个文件，才发现是一个脚本。比我想象的简单多了，相当于分析了一下shell脚本执行时的strace，:-(

看到这里震惊了，Linux系统出现病毒文件，并且还能对外发起syn flood攻击。一下子就明了了。这个so文件也是3月30号创建的，然后也尝试执行了一下，strace日志比较复杂，有大量的网络操作。剩下的就没细看了，直接Google，找到了非常接近的介绍：Linux.Siggen.5802，按照这里给的列表，逐一确认是否病毒文件，逐一删除，并清理掉病毒生成的Cron任务。

最后还想找到3月30号系统是如何安装上这个病毒的，找了系统日志，没有发现太大的异常，不知道跟下面这个是否有关系，好像早先折腾过UI界面的桌面环境，不知道是不是当时下载了非标的安装包带入的：

不管了，这个也一并卸载了。

最后网络终于恢复宁静了。总结一下，就是syn flood包把光猫或者路由器的带宽和连接资源耗尽，然后NAS自己的网络也占满，最终导致终端上网异常。我是在NAS上面部署了dnsmasq作为局域网的解析，因此有时候还表现为终端能用聊天软件，而不能打开网页。

其实中途，一度怀疑新买的Wifi6路由器不稳定，考虑弄一个二手的企业路由器拨号看看，找到了tplink r473g，还打开了调试模式，登录到路由器的shell里面，尝试用top+nc，把实时的top命令结果传出来，最终也确实有所发现，就是当网络异常时，路由器的CPU是满的，然后CPU用在soft irq上面，就是在不停的响应网络中断，看到这里也没什么头绪。当时就想在路由器上面抓包，但是busybox系统没有默认带这个，也没有curl等命令能把抓包数据传出去，难度有点大，就先放弃了，直到这周五发现HomeNAS经常有流量尖峰，才朝着HomeNAS上面去定位流量异常的这个方向走。最早是考虑局域网内的终端访问NAS带来的，逐个排查是哪个终端导致的，甚至二分法逐一关闭容器，都无果。最终还是抓包+系统日志找到了问题。HomeNAS上面，一般是用docker，很少安装不明二进制包，偶尔安装不明的来源的docker镜像。docker里面搞破坏应该很少能破坏宿主机。目前看来，这个病毒做得还不算绝，没有动系统文件，估计也怕jc抓。计算机世界的病毒跟自然界一样，都是希望跟宿主和谐共处，薅一点资源生存。以前只听说黑客利用系统漏洞，做一些攻击，也一直认为Linux很安全，没什么病毒。第一次经历Linux系统被植入病毒木马，上了重要的一课。

附：一些定位过程中的命令
接收远端日志：(nc -l 12599 -k >> router_log.txt &)
路由器跟踪top：(top –n 1 –d 3 |nc –v 22.22.22.3 12599 &)，具体的循环任务忘记了，路由器的top没有打印时间，需要定时增加时间信息输出。
持续抓包：(tcpdump -i eno1 ‘not port 6870 and not port 22 and not port 443’ -s 96 -w all.cap -C 300 &)
iftop持续跟踪系统连接：(while :; do echo `date`>>iftop_all.txt; iftop -t -BNPn -s 10 -o 10s -i eno1 2>/dev/null >> iftop_all.txt; done &)
使用ntopng监控系统网络事件，使用iftop命令监控，跟Prometheus+Grafana的结果差不多，仅仅多了基于连接的统计结果。但是这种半连接过程的数据没有统计。

(5.00分 - 1票)

Loading ... | 同时归档在：WEB网络, 奇趣见闻, 数码硬件 | 标签： Home-NAS, Home-Server, linux, 计算机病毒 |

HomeServer 2024升级计划

作者：童燕群 | 发布日期：二月 11, 2024 | 阅读次数（131） | 评论

计划过完年升级一下HomeServer，主要是docker里面的容器越来越多，计算能力明显不足。有时候想做一些人工智能相关大模型的实验，跑不动，还有emby在播放高清视频时服务端解码能力不够，导致卡顿的问题。

已经忘记了上一次升级是什么时候，只记得全网搜寻多SATA接口的itx主板，除了那几个板载赛扬处理器软路由系列的，没有更合适的。退而求其次，考虑有个x16的pcie 3.0，然后插阵列卡或者转换卡，也能达到支持高规格CPU和多SATA接口的目标。考虑一个z270 itx的，能支持6、7、8代的CPU，有一个全速的pcie 3.0 x16插口，淘了微星贴牌海盗船的。然后就是各种配件依照规格下单：

lsi2308 SAS卡转4SATA接口线
ddr4 8GB*2
core i3 6100t（35瓦）
暴风影音4盘位itx机箱
1u电源

原来的SATA接口SSD重用

快递陆续到达后，装机，装系统，一次点亮，后面就是各种折腾docker，各种开源、自研软件部署。

想不到几年间，牙膏厂都挤到14、15代了。年前就在偶尔查新的itx主板，发现h610、b760和z690itx板都能支持12代，某些能刷BIOS后支持13代，且一般都有4SATA，2M.2接口，这就是一个标准4盘位NAS的要求啊。考虑将来继续升级，决定在b760和z690之间选，b760itx一般是ddr4，z690itx是ddr5的，当前ddr5内存价格是ddr4的两倍，性价比有点低。从主板本身价格看，在某鱼上面，二者相差不大，但新品差别很大，差不多贵1/3。是不是也有ddr5太贵导致z690的二手市场不活跃。CPU没有太多选择，只能是带t低功耗版本，考虑12600t，不知道超薄散热风扇是否够用。

考虑后面内存升级后还能用，最终决定还是咬咬牙上690itx，690itx+12600t+ddr5，12600t配这个主板是不是有点过于浪费了，就当升级预埋了，哈哈哈。原来的sas卡也就不需要了，系统整体功耗应该还会降一点。SATA SSD也用不了，还要补一块M.2的SSD。希望替换下来的6100t+微星z270itx+ddr4 8GB*2能顺利出掉，抵消一点升级成本。就这么愉快的决定了，修完春节长假就开整。

(4.50分 - 2票)

Loading ... | 同时归档在：数码硬件 | 标签： Home-NAS, Home-Server |

HomeServer直播、监控方案实践

作者：童燕群 | 发布日期：九月 28, 2023 | 阅读次数（186） | 评论

直播的基本原理是终端采集音视频流，推送到服务器，然后又由播放终端来拉取直播流。整体的数据流如下图所示：

图片来源于：https://juejin.cn/post/6844904179836813325

阅读全文 »

(5.00分 - 1票)

Loading ... | 同时归档在：数码硬件, 软件应用, 软件技术 | 标签： Home-Server, WEB网络, 互联网, 树莓派3, 监控, 直播, 视频监控 |

HomeServer安装在线Office：Docker安装最新精简版OnlyOffice

作者：童燕群 | 发布日期：十月 12, 2022 | 阅读次数（1,595） | 评论（1）

最近从这个帖子看到一些有趣的企业软件，其中有一个在线办公软件OnlyOffice，感觉挺有意思的。之前一直为各种自建网盘无法打开Office文档而烦恼，看到FileRun可以集成OnlyOffice DocumentServer，于是就决定开始搭建这个，解决自建网盘直接预览和编辑文档的问题。目前在用的3款网盘软件，还只发现FileRun支持，其他几款如FileBrowser、Cloudreve都还不支持。FileBrowser的Git库上面，有人提交了PR，但是迟迟没有被approve和合入。看起来挺简单的集成功能，不清楚开源owner为什么不合入。

第三方提供的界面总归还是有些不够专业，于是想着自己搭建一个完整的在线Office。经过一番摸索，需要DocumentServer+CommunityServer配合。前者只是一个文档查阅和编辑器，后者提供UI管理文档。当然也可以仅仅只搭建DocumentServer，用第三方的UI来集成，FileRun就算，还有更多的，笔者并没有作更多探索。这里的CommunityServer是一个复杂的办公Workspace，包括一系列的复杂的项目管理、团队管理等套件，这些套件全部包含在内，显得整个docker非常臃肿，资源有限的HomeNAS难以支撑，于是针对这个CommunityServer又做了一些裁剪，主要是把一些感觉用不到的进程停掉了，自己做了docker镜像，也上传到了dockerhub上面。下面开始介绍这两个组件的安装配置过程。

DocumentServer搭建很简单，毕竟依赖的组件少，官方docker镜像也非常简洁，很快就按照官方给的安装命令在HomeNAS上面跑起来了，并且简单配置之后就能在FileRun上面直接查阅和编辑Office文档了。但是发现一个问题，就是DocumentServer为了确保安全，默认启用了jwt_token。token确实有用，可以避免DocumentServer被盗用，被任意其他网络服务拿去使用耗费有限的资源，因此token是UI和Server之间通信的安全保障。有一个问题是，DocumentServer的jwt_token在每次DS重启之后就会重新生成，这样FileRun上面又要重新设置，经过分析，可以用Docker的环境变量指定一个固定的token。然后，如果没有指定外部DB，则DocumentServer会自己启动一个内建的mysql，这个mysql与已有的外部的mysql重复了，没必要，因此我选择使用外部的mysql来公用，节省资源。最终具体的运行命令如下：

docker run –net onlyoffice –name onlyoffice-document-server -d -p 127.0.0.1:12583:80 \
-e DB_TYPE=mysql \
-e DB_HOST=IP_OF_YOUR_DB_HOST \
-e DB_PORT=3306 \
-e DB_NAME=onlyoffice \
-e DB_USER=USERNAME_OF_YOUR_DB \
-e “DB_PWD=PASSWORD_OF_YOUR_DB” \
-e JWT_ENABLED=true \
-e “JWT_SECRET=YOUR_FIX_JWT_TOKEN” \
-v /your/app/path/DocumentServer/logs:/var/log/onlyoffice \
-v /your/app/path/DocumentServer/data:/var/www/onlyoffice/Data \
onlyoffice/documentserver:latest

上面只开启DS的http端口，同样使用系统统一的一个Nginx反向代理HTTPS对外提供服务。docker启动后，占用的资源非常少。具体的进程列表如下：

CommunityServer的安装过程就比较坎坷了，主要是想禁用多个暂时不需要的服务，笔者这里主要禁用elasticsearch、内部自带的mysql、还有一堆的Soauth、API、迁移数据、自动清理数据、备份数据、Chat服务等，感觉对于只想体验一下在线Office而言，这些都用不上，禁止之后也没有发现有什么地方运行异常，只用修改run-community-server.sh这个文件，然后重新打镜像即可。如果不做这个裁剪，我的四核6100T的CPU，16G内存，都非常吃力，并且还频繁崩溃重启。最终精简版的进程列表如下：

修改后的镜像我也上传到了，自己的dockerhub账号下：

https://hub.docker.com/repository/docker/shentar/onlyoffice-community-server

docker pull shentar/onlyoffice-community-server:latest

CommunityServer要使用token访问DocumentServer时，有点坑，找遍了各种设置界面都没看到，网上也没有任何资料介绍，最终在官方给的docker安装脚本中找到了，也是通过一个环境变量来指定。这样只要将该变量指定为DS的token即可。需要注意的是，CommunityServer也有自己的jwt_token，因此这两个都要指定，才能正常运转。具体的环境变量名为：

DOCUMENT_SERVER_JWT_ENABLED
DOCUMENT_SERVER_JWT_SECRET

最终，安装CommunityServer的命令为：

docker run –net onlyoffice -i -t -d –privileged –restart=always \
–name onlyoffice-community-server -p 127.0.0.1:12555:80 \
-e “MYSQL_SERVER_ROOT_PASSWORD=YOUR_MYSQL_PASSWORD” \
-e MYSQL_SERVER_DB_NAME=onlyoffice \
-e MYSQL_SERVER_HOST=YOUR_MYSQL_HOST \
-e MYSQL_SERVER_USER=YOUR_MYSQL_USERNAME \
-e “MYSQL_SERVER_PASS=YOUR_MYSQL_PASSWORD” \
-e JWT_ENABLED=true \
-e “JWT_SECRET=YOUR_FIX_JWT_TOKEN” \
-e “DOCUMENT_SERVER_JWT_ENABLED=true” \
-e “DOCUMENT_SERVER_JWT_SECRET=YOUR_FIX_JWT_TOKEN” \
-v /your/app/path/CommunityServer/data:/var/www/onlyoffice/Data \
-v /your/app/path/CommunityServer/logs:/var/log/onlyoffice \
-v /your/app/path/DocumentServer/data:/var/www/onlyoffice/DocumentServerData \
-v /sys/fs/cgroup:/sys/fs/cgroup:ro \
shentar/onlyoffice-community-server:latest

同样只开启HTTP，利用外部的Nginx来实现HTTPS反向代理，省去了一大堆SSL证书相关的事情。最终运行起来的效果如下图。测试了各项基本功能，都是正常的，精简掉的那些进程暂时用不着。

(5.00分 - 4票)

Loading ... | 同时归档在：WEB网络, 数码硬件, 软件应用 | 标签： Home-NAS, Home-Server, OnlyOffice, 在线Office, 移动办公 |

开源好用的电子书管理服务Talebook（Calibre网络版）安装使用指南

作者：童燕群 | 发布日期：四月 23, 2022 | 阅读次数（11,203） | 评论（122）

今天是世界读书日，介绍一款已经用过一段时间的电子书在线管理、阅读服务。Talebook是一个开源的Calibre WEB外壳，源项目地址是：Github项目，我为了方便自己开发，在自己的代码托管服务上放了一份源码，方便存放自己的开发过程代码。也经常将自己用稳定了的特性或者修改的Bug提交MR推送到原作者的项目中。我主要会根据自己的需要开发一些特性和修复我认为比较关键的bug。代码地址为：自用Talebook地址，Docker镜像地址。增加了多个特性，如：限制单个IP地址下载书籍的数量限制特性，用来防止爬虫大并发爬取书籍，导致站点不可用。另外还增加了一些统计信息和界面修改等，具体的差异点可以对比两个代码工程的获取。我也会持续跟进源项目的新特性，实时合并，也继续推送自己的修改到源项目。

更新记录列表：

支持限制单个IP地址下载数量；
支持随机推荐和最新书籍推荐手动刷新；
支持个人阅读、访问、下载和推送记录，也支持一键清除，优化历史记录页面；
新增“我的收藏”功能；
上传成功的图书即从upload目录删除，避免书籍被保存两份，浪费空间；
导入页面，在删除导入记录的同时，也删除上传到uploads目录的图书；
书籍页面新增豆瓣链接；
支持“分类导览”页面可定制，修改本地的data/books/settings/tags.yaml文件，然后重启容器即可；
支持添加“自定义运行脚本”，可以指定站点跟踪脚本；
支持批量删除数据、批量添加标签、批量抓取元数据；
支持流式加载PDF文件阅读。
支持批量抓取豆瓣元信息，并且批量确认和取消。配合shentar/douban_api:latest镜像使用；
“所有书籍”页面支持按照书名拼音排序。

跟原项目一样，我也基于仓库代码生成了镜像，推送到了dockerhub，有了Docker镜像，安装使用起来就非常方便：

docker run -d --name calibre \

-p 127.0.0.1:12579:80 \

-v /media/c2/docker/calibre/data:/data \

-E TZ="Asia/Shanghai" \

shentar/talebook:latest

我这里将容器内的80端口映射到本机的内部随机端口，然后再在宿主机上面使用Nginx反向代理对外提供HTTPS服务。反向代理时，需要注意一些配置：

server {

    listen 6870 ssl http2;

    server_name book.codefine.site;

    index index.html index.htm index.php default.html default.htm default.php;

    root /any/local/path/;

    ssl_certificate ***********;

    ssl_certificate_key ***********;

    ssl_protocols TLSv1 TLSv1.1 TLSv1.2;

    client_max_body_size 500M;

    location / {

        proxy_pass http://127.0.0.1:12579/;

        proxy_set_header Host $http_host;

        proxy_set_header X-Forwarded-Proto $scheme;

        proxy_set_header X-Nginx-Proxy true;

        proxy_set_header X-Scheme $scheme;

        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;

        proxy_set_header X-Real-IP $remote_addr;

        proxy_set_header Upgrade $http_upgrade;

        proxy_set_header Connection $http_connection;

    access_log on;

注意这些Header必须正确设置，否则可能无法正常打开主页。剩下的就是从网页打开宿主机的6870端口即可访问。我的宿主机是有域名的因此，我的站点的地址就是：https://book.codefine.site:6870，首次打开时，会做一些必要的配置，如私人模式还是多用户模式。admin账号和密码设置等。完成后就可以愉快的使用talebook存取电子书籍了。对于网络下载的各种电子书文件，元信息可能都不准确，因此需要从豆瓣等刮削元信息。开源社区有一个现成的刮削服务，douban-api-rs：源码地址为：https://github.com/cxfksword/douban-api-rs，这个也提供Docker的安装方式，不过作者并没有在Dockerhub上面放镜像。而是在Github自己的镜像服务上面托管镜像。如果是命令行安装，只需要执行如下命令即可：

docker run -d \

--name=douban-api-rs \

--restart=always \

-p 172.17.0.1:8080:80

ghcr.io/cxfksword/douban-api-rs:latest

~~如果是群晖等NAS服务，则需要自行配置新的镜像源才能拉去到该镜像。具体笔者没有使用过，需要自行探索。~~可以使用如下docker部署刮削服务，注意，本站的talebook镜像必须配套这个刮削服务，如果混用会有各种异常，或导致IP地址被豆瓣禁用。 https://hub.docker.com/r/shentar/douban_api，

docker run -p 172.17.0.1:12568:8080 --name douban_api --restart=always \
-v /your/data/volume/full/path/:/data \
-v /etc/timezone:/etc/timezone:ro \
-v /etc/localtime:/etc/localtime:ro \
-e LOG_LEVEL="warn" \
-e COOKIE='your douban login cookie' \
-d shentar/douban_api:latest

然后到Talebook的高级配置项目中配置即可：

我这里之所以选择使用172.17.0.1作为监听地址，是因为这个地址是我的docker服务的网络的虚拟网关，宿主机也能访问这个IP地址。这样，在Talebook内部就能用这个地址与豆瓣刮削服务通信。上传电子书之后，只要设置正确的书籍名字即可进行全量元数据的抓取了。豆瓣网站不再提供书籍的标签（Tag）了，因此Talebook服务端做了从作者、标题和书籍摘要中匹配Tag的实现，准确率还行。感谢Talebook作者贡献这么好的开源项目，并且多年来还在积极维护。这个项目也让我初步接触到Vue.js、Node.js、Python3 Tornado等生态，开发WEB项目，使用这些组件，效率极高。什么时候有精力可以把jAlbum的前端好好用这些写一下。

(5.00分 - 5票)

Loading ... | 同时归档在：WEB网络, 建站技术, 数码硬件 | 标签： epub, Home-NAS, Home-Server, pdf, 书库, 电子书 |

Home NAS 音乐服务解决方案

作者：童燕群 | 发布日期：十二月 25, 2021 | 阅读次数（3,356） | 评论（2）

之前写过使用《使用Emby + Picard管理音乐》的方案，Emby有一个问题，在划词搜索方面，必须前缀或者整词完整匹配，对于港台音乐名和元数据多是繁体字，用简体搜索时，无法匹配，一直希望能够模糊匹配，发现airsonic-advance这方面没问题，完美解决搜索问题。

阅读全文 »

(5.00分 - 1票)

Loading ... | 同时归档在：数码硬件, 软件应用 | 标签： airsonic-advance, Home-NAS, Subsonic, substreamer, 多媒体管理 |

自制一个动态域名解析系统

作者：童燕群 | 发布日期：九月 17, 2021 | 阅读次数（659） | 评论（1）

之前一直用路由器自带的动态域名解析（Dynamic DNS，DDNS）系统，一般路由器自行提供一个，或者直接对接花生壳。路由器自带的几乎不能登录，花生壳也是经常性的退出登录，或者直接把域名解析为127.0.0.2，遇到好几次了，难以忍受。仔细研究了一下百度云的域名服务，希望找到一个能够通过远程调用设置A记录的入口。找到了这个介绍链接：更新域名记录，使用百度云的域名解析服务的API可以实现对域名解析的各种远程操作。首先在《HomeNAS IP地址变化》中介绍了如何获取本机真实IP的方法，然后当监控到IP发生变化时，调用API设置A记录即可。本来想使用Python SDK简单写几行脚本直接运行起来就好，结果百度云域名服务的Python SDK以及给出的几行样例代码漏洞百出，没法实际运行起来。只能做个Java Jar包供命令行调用了。这样终于搞定了一个可以长时间稳定运行的DDNS实现，一个完美的花生壳替代品。

先列举所有主域名的解析配置，找到需要修改的那一项，然后使用列举得到的ID设置新的IP地址即可。详细代码参见如下工程：https://git.codefine.site:3000/Shentar/setdomain2

(5.00分 - 1票)

Loading ... | 同时归档在：WEB网络 | 标签： DDNS, Home-NAS, 花生壳替代 |

HomeNAS IP变化规律

作者：童燕群 | 发布日期：三月 7, 2021 | 阅读次数（545） | 评论

成都电信分配给个人的家用宽带IP地址定期更新，本来是用来快速发现变化后的IP地址的一个任务，解决IP地址变化后需要15分钟才能登录的问题，结果让发现了IP地址变化的规律。每隔6天，在每天中午11点20后的一个小时内更新IP地址。不知道是只针对特定账号的任务还是所有人同一时刻变更。

阅读全文 »

(5.00分 - 1票)

Loading ... | 同时归档在：WEB网络, 实用脚本 | 标签： Home-NAS, 电信宽带, 监控 |

分享一个实时抓取IT相关博客和新闻的业务

作者：童燕群 | 发布日期：一月 17, 2021 | 阅读次数（527） | 评论

一直通过TTRSS订阅各大IT门户和博客的文章，其实这些内容更适合公开访问，于是简单做了个页面，后台通过java程序直接访问TTRSS的数据库生成页面。内容不是全网爬取的，是定点几个比较大的门户网站的，搜索条件比较简单，通过关键词过滤内容或者标题。后台准实时拉取各个Feed的文章，然后定时半个小时刷新一次页面，半个小时内，网页呈现都是缓存的内容。因为爬取数据的过程是现成的，主要工作是做个动态页面，几个小时就搞定了。程序放在家里的NAS上面运行。

访问地址：https://news.codefine.site:12524。

(5.00分 - 1票)

Loading ... | 同时归档在：WEB网络, 软件应用 | 标签： IT, RSS, TTRSS, 新闻, 爬虫 |

分享一个追最新外语电影的RSS

作者：童燕群 | 发布日期：十二月 31, 2020 | 阅读次数（4,085） | 评论

国内的Torrent分享网站越来越少了，无意中发现https://www.demonoid.is/可以下载到最新的高清/超清电影。但是有点比较讨厌，就是弹窗有点过份，不是我白嫖了种子还不愿支持广告，真是弹窗太过三俗刺眼，难以忍受。于是试着分析了网页内容，自己抓取电影种子文件链接，并添加Google搜索IMDB的链接，制作了RSS订阅链接。本来还想找一下有没有类似的Torrent分享站点，发现demonoid是与海盗湾齐名的，之前排名前几的站点已经都无法打开了，只剩这一个，切用且珍惜吧 :-) 源站地址：链接，经过抓取清洗和加工后生成的RSS链接为：https://photo.codefine.site:5443/rssfactory/demonoid-movies，只抓取了1080P及其以上质量的电影。