分类目录：软件应用

cloudflare的妙用
HomeServer直播、监控方案实践
HomeServer安装在线Office：Docker安装最新精简版OnlyOffice
Home NAS 音乐服务解决方案
Home-Server磁盘降温记
分享一个实时抓取IT相关博客和新闻的业务
分享一个追最新外语电影的RSS
分享AWS博客的两个RSS源
使用Emby + Picard管理音乐
基于Dlib、Flask和Sqlite的人脸检测和识别服务

cloudflare的妙用

作者：童燕群 | 发布日期：一月 11, 2025 | 阅读次数（38） | 评论（1）

对于个人玩家，cloudflare免费计划有一些有趣的功能。如：免费的DNS托管，流量代理。基于这两项衍生出来的自动生成TLS证书，服务非标端口转发，Worker反向代理等。其中最有用的还是流量代理。之前一直是使用阿里云的ECS+备案来搭建本站的。在发现cloudflare的代理能力之后，果断将阿里云ECS停止续费了。实际也是续费到后面，价格越来越高，对个人用户而言，为了维持公网上面的几乎无访问量的博客，每年几百到一千的续费太奢侈。

将域名托管到cloudflare后，配置流量代理，然后博主本地电信宽带本来就提供公网IP，直接申购域名+家用HomeServer+cloudflare就能搭建一个标准的WEB服务。在本来就24小时开机的HomeServer基础上，实现了免费博客托管。现在本站即托管在家用服务器了。

用了一段时间发现，cloudflare的IP会被connection reset/refused，这应该由于某些已知的不可抗原因导致的。进一步发现cloudflare的几千个IP地址都是同样可以用来做代理转发流量的，只是cloudflare的免费计划没有提供自主选择IP的方式，需要一些hack手段。比如：如果是桌面操作系统主机，则可以自行配置Hosts文件指定IP地址（官网也提供了可用IP列表），当前本站即处于时而能访问时而不能访问的边缘。这对我个人写博客看博客而言，没有什么影响，对外部客户端访问本站有很大问题，远不如备案+ECS稳定，网速也差得远，因为cloudflare的代理IP都在国外，在国内访问本站，相当于流量从本地转发到国外，再绕回来，这样时延都是秒级，体验很差，但是能免费托管，还要啥自行车：）

有时候，由于出海需要，也要申请国外的VPS，这样可以用cloudflare的庞大IP地址集的代理能力做一个稳定的流量通道。要达成自主选择IP地址的目的，一个可以指定解析结果的DNS服务器就必不可少，在内网，可以使用dnsmasq+dhcp指定内网设备的解析结果。但是经常我们在外面，需要使用移动网络，这个时候，就没法访问内部的dns服务，同样，是桌面系统还好，能指定，手机呢？android系统有个配置私密dns的能力，必须是支持DoT或者DoH的dns服务器，并且该服务的地址要有自己的域名。查询chatgpt，给出了dnsmasq+stunnel的方案，进一步问到了把这个服务做成docker镜像的Dockerfile写法。按照给出的配置和打包流程，做成了镜像放到dockerhub上面了：链接。

上面提供了一些思路和大致的玩法，很多东西没法描述到太细，有了一个稳定的流量代理，大家可以充分发挥想象去做一些有趣的访问应用。最后给出一个HomeServer+cloudflare+外部VPS的连接示意图：

(5.00分 - 1票)

Loading ... | 同时归档在：建站技术, 移动互联 | 标签： cloudflare, Home-NAS, Home-Server, VPS, 建站 |

HomeServer直播、监控方案实践

作者：童燕群 | 发布日期：九月 28, 2023 | 阅读次数（244） | 评论

直播的基本原理是终端采集音视频流，推送到服务器，然后又由播放终端来拉取直播流。整体的数据流如下图所示：

图片来源于：https://juejin.cn/post/6844904179836813325

阅读全文 »

(5.00分 - 1票)

Loading ... | 同时归档在：数码硬件, 移动互联, 软件技术 | 标签： Home-Server, WEB网络, 互联网, 树莓派3, 监控, 直播, 视频监控 |

HomeServer安装在线Office：Docker安装最新精简版OnlyOffice

作者：童燕群 | 发布日期：十月 12, 2022 | 阅读次数（1,690） | 评论（1）

最近从这个帖子看到一些有趣的企业软件，其中有一个在线办公软件OnlyOffice，感觉挺有意思的。之前一直为各种自建网盘无法打开Office文档而烦恼，看到FileRun可以集成OnlyOffice DocumentServer，于是就决定开始搭建这个，解决自建网盘直接预览和编辑文档的问题。目前在用的3款网盘软件，还只发现FileRun支持，其他几款如FileBrowser、Cloudreve都还不支持。FileBrowser的Git库上面，有人提交了PR，但是迟迟没有被approve和合入。看起来挺简单的集成功能，不清楚开源owner为什么不合入。

第三方提供的界面总归还是有些不够专业，于是想着自己搭建一个完整的在线Office。经过一番摸索，需要DocumentServer+CommunityServer配合。前者只是一个文档查阅和编辑器，后者提供UI管理文档。当然也可以仅仅只搭建DocumentServer，用第三方的UI来集成，FileRun就算，还有更多的，笔者并没有作更多探索。这里的CommunityServer是一个复杂的办公Workspace，包括一系列的复杂的项目管理、团队管理等套件，这些套件全部包含在内，显得整个docker非常臃肿，资源有限的HomeNAS难以支撑，于是针对这个CommunityServer又做了一些裁剪，主要是把一些感觉用不到的进程停掉了，自己做了docker镜像，也上传到了dockerhub上面。下面开始介绍这两个组件的安装配置过程。

DocumentServer搭建很简单，毕竟依赖的组件少，官方docker镜像也非常简洁，很快就按照官方给的安装命令在HomeNAS上面跑起来了，并且简单配置之后就能在FileRun上面直接查阅和编辑Office文档了。但是发现一个问题，就是DocumentServer为了确保安全，默认启用了jwt_token。token确实有用，可以避免DocumentServer被盗用，被任意其他网络服务拿去使用耗费有限的资源，因此token是UI和Server之间通信的安全保障。有一个问题是，DocumentServer的jwt_token在每次DS重启之后就会重新生成，这样FileRun上面又要重新设置，经过分析，可以用Docker的环境变量指定一个固定的token。然后，如果没有指定外部DB，则DocumentServer会自己启动一个内建的mysql，这个mysql与已有的外部的mysql重复了，没必要，因此我选择使用外部的mysql来公用，节省资源。最终具体的运行命令如下：

docker run –net onlyoffice –name onlyoffice-document-server -d -p 127.0.0.1:12583:80 \
-e DB_TYPE=mysql \
-e DB_HOST=IP_OF_YOUR_DB_HOST \
-e DB_PORT=3306 \
-e DB_NAME=onlyoffice \
-e DB_USER=USERNAME_OF_YOUR_DB \
-e “DB_PWD=PASSWORD_OF_YOUR_DB” \
-e JWT_ENABLED=true \
-e “JWT_SECRET=YOUR_FIX_JWT_TOKEN” \
-v /your/app/path/DocumentServer/logs:/var/log/onlyoffice \
-v /your/app/path/DocumentServer/data:/var/www/onlyoffice/Data \
onlyoffice/documentserver:latest

上面只开启DS的http端口，同样使用系统统一的一个Nginx反向代理HTTPS对外提供服务。docker启动后，占用的资源非常少。具体的进程列表如下：

CommunityServer的安装过程就比较坎坷了，主要是想禁用多个暂时不需要的服务，笔者这里主要禁用elasticsearch、内部自带的mysql、还有一堆的Soauth、API、迁移数据、自动清理数据、备份数据、Chat服务等，感觉对于只想体验一下在线Office而言，这些都用不上，禁止之后也没有发现有什么地方运行异常，只用修改run-community-server.sh这个文件，然后重新打镜像即可。如果不做这个裁剪，我的四核6100T的CPU，16G内存，都非常吃力，并且还频繁崩溃重启。最终精简版的进程列表如下：

修改后的镜像我也上传到了，自己的dockerhub账号下：

https://hub.docker.com/repository/docker/shentar/onlyoffice-community-server

docker pull shentar/onlyoffice-community-server:latest

CommunityServer要使用token访问DocumentServer时，有点坑，找遍了各种设置界面都没看到，网上也没有任何资料介绍，最终在官方给的docker安装脚本中找到了，也是通过一个环境变量来指定。这样只要将该变量指定为DS的token即可。需要注意的是，CommunityServer也有自己的jwt_token，因此这两个都要指定，才能正常运转。具体的环境变量名为：

DOCUMENT_SERVER_JWT_ENABLED
DOCUMENT_SERVER_JWT_SECRET

最终，安装CommunityServer的命令为：

docker run –net onlyoffice -i -t -d –privileged –restart=always \
–name onlyoffice-community-server -p 127.0.0.1:12555:80 \
-e “MYSQL_SERVER_ROOT_PASSWORD=YOUR_MYSQL_PASSWORD” \
-e MYSQL_SERVER_DB_NAME=onlyoffice \
-e MYSQL_SERVER_HOST=YOUR_MYSQL_HOST \
-e MYSQL_SERVER_USER=YOUR_MYSQL_USERNAME \
-e “MYSQL_SERVER_PASS=YOUR_MYSQL_PASSWORD” \
-e JWT_ENABLED=true \
-e “JWT_SECRET=YOUR_FIX_JWT_TOKEN” \
-e “DOCUMENT_SERVER_JWT_ENABLED=true” \
-e “DOCUMENT_SERVER_JWT_SECRET=YOUR_FIX_JWT_TOKEN” \
-v /your/app/path/CommunityServer/data:/var/www/onlyoffice/Data \
-v /your/app/path/CommunityServer/logs:/var/log/onlyoffice \
-v /your/app/path/DocumentServer/data:/var/www/onlyoffice/DocumentServerData \
-v /sys/fs/cgroup:/sys/fs/cgroup:ro \
shentar/onlyoffice-community-server:latest

同样只开启HTTP，利用外部的Nginx来实现HTTPS反向代理，省去了一大堆SSL证书相关的事情。最终运行起来的效果如下图。测试了各项基本功能，都是正常的，精简掉的那些进程暂时用不着。

(5.00分 - 4票)

Loading ... | 同时归档在：WEB网络, 数码硬件, 移动互联 | 标签： Home-NAS, Home-Server, OnlyOffice, 在线Office, 移动办公 |

Home NAS 音乐服务解决方案

作者：童燕群 | 发布日期：十二月 25, 2021 | 阅读次数（3,507） | 评论（2）

之前写过使用《使用Emby + Picard管理音乐》的方案，Emby有一个问题，在划词搜索方面，必须前缀或者整词完整匹配，对于港台音乐名和元数据多是繁体字，用简体搜索时，无法匹配，一直希望能够模糊匹配，发现airsonic-advance这方面没问题，完美解决搜索问题。

阅读全文 »

(5.00分 - 1票)

Loading ... | 同时归档在：数码硬件, 移动互联 | 标签： airsonic-advance, Home-NAS, Subsonic, substreamer, 多媒体管理 |

Home-Server磁盘降温记

作者：童燕群 | 发布日期：十月 14, 2021 | 阅读次数（482） | 评论

由于内存不足，Home-Server上面运行的虚拟Windows主机经常宕机，就想着给Home-Server更换一根16GB内存。小机箱内部空间狭小，部件接合紧密，拆机时把机箱风扇给扯断了。费了老大的劲儿，内存条是装上去了，开机也能识别，但是少了个风扇。

（图片源于网络）

当天晚上，重新还原各个部件到机箱内部，后来太晚了，机箱就没有封盖，准备第二天早上再弄，心想少一个机箱风扇应该也没多大事。结果，第二天早上，准备关机装机箱盖，运行了一晚的服务器，发现磁盘烫手，都有开水的温度了。不对劲，赶紧安装hddtemp检查磁盘温度，发现竟然达到70多度。这样太危险了，影响磁盘寿命，赶紧某宝下单一个宣称4K转速20元包邮的机箱风扇（最终实际能跑到3100转，但是已经够用了。）。历经3天，快递终于到了。装到机箱后，默认是自动调速模式，声音大的有点像置身机房，这样放在家里，肯定难以接受。研究了半天，将/sys/class/hwmon/hwmon2/pwm1_enable置为1，然后设置/sys/class/hwmon/hwmon2/pwm1的值尽可能小，以降低转速，发现最小转速就是1500多，再小风扇就停止转动。1500转，声音小多了，噪音可以接受了，温度也还正常。

在这个过程中，还研究了一下使用Grafana监控磁盘温度的方法，Prometheus官方提供的node-exporter没有提供hddtemp相关的功能，找了半天，也没有人提供能用的基于hddtemp的监控exporter，于是写了一个循环运行的Shell脚本+PushGateWay实现了一个磁盘温度的exporter。

经过一番折腾，磁盘温度降到能接受的40度左右的范围了，对比效果见下面的监控图。在没有风扇的时候，发现不仅磁盘温度非常高，磁盘温度还会将CPU温度拉高。把磁盘挪开，则CPU温度在正常范围。SAS盘温度高真不虚。这次拆装机颠覆了我对磁盘温度的认识。之前一直认为磁盘运转过程中不需要风扇，机箱风扇是给整个机箱内部的除CPU外的部件散热，但重点不是磁盘，没想到在小机箱里面磁盘是发热量的大头。

(5.00分 - 2票)

Loading ... | 同时归档在：数码硬件 | 标签： Grafana, hddtemp, Home-NAS, Home-Server, node-exporter, Prometheus |

分享一个实时抓取IT相关博客和新闻的业务

作者：童燕群 | 发布日期：一月 17, 2021 | 阅读次数（531） | 评论

一直通过TTRSS订阅各大IT门户和博客的文章，其实这些内容更适合公开访问，于是简单做了个页面，后台通过java程序直接访问TTRSS的数据库生成页面。内容不是全网爬取的，是定点几个比较大的门户网站的，搜索条件比较简单，通过关键词过滤内容或者标题。后台准实时拉取各个Feed的文章，然后定时半个小时刷新一次页面，半个小时内，网页呈现都是缓存的内容。因为爬取数据的过程是现成的，主要工作是做个动态页面，几个小时就搞定了。程序放在家里的NAS上面运行。

访问地址：https://news.codefine.site:12524。

(5.00分 - 1票)

Loading ... | 同时归档在：WEB网络, 移动互联 | 标签： IT, RSS, TTRSS, 新闻, 爬虫 |

分享一个追最新外语电影的RSS

作者：童燕群 | 发布日期：十二月 31, 2020 | 阅读次数（4,293） | 评论

国内的Torrent分享网站越来越少了，无意中发现https://www.demonoid.is/可以下载到最新的高清/超清电影。但是有点比较讨厌，就是弹窗有点过份，不是我白嫖了种子还不愿支持广告，真是弹窗太过三俗刺眼，难以忍受。于是试着分析了网页内容，自己抓取电影种子文件链接，并添加Google搜索IMDB的链接，制作了RSS订阅链接。本来还想找一下有没有类似的Torrent分享站点，发现demonoid是与海盗湾齐名的，之前排名前几的站点已经都无法打开了，只剩这一个，切用且珍惜吧 :-) 源站地址：链接，经过抓取清洗和加工后生成的RSS链接为：https://photo.codefine.site:5443/rssfactory/demonoid-movies，只抓取了1080P及其以上质量的电影。

订阅后的呈现效果：

同时也制作了HTML版的独立网页：

https://movie.codefine.site:5443/

电影详情页，包含两个torrent下载地址，IMDB和豆瓣搜索链接。

(5.00分 - 1票)

Loading ... | 同时归档在：WEB网络, 数码硬件, 移动互联 | 标签： Home-NAS, RSS, 电影 |

分享AWS博客的两个RSS源

作者：童燕群 | 发布日期：十二月 9, 2020 | 阅读次数（397） | 评论

为了第一时间获取AWS的几百个云服务的最新资讯，做了一个自动抓取AWS博客标题，生成RSS Feeds的服务，分别提供中英文版本：
中文：https://photo.codefine.site:12524/rssfactory/awsblogcn
英文：https://photo.codefine.site:12524/rssfactory/awsblog （过滤标题中包含存储相关关键词的博客。）
AWS存储：https://photo.codefine.site:12524/rssfactory/awsblog-storage （订阅存储、大数据和数据库类别的博客。）

(5.00分 - 1票)

Loading ... | 同时归档在：Amazon S3, Java, 云计算/云存储, 文字网摘 | 标签： AWS, AWS S3, RSS |

使用Emby + Picard管理音乐

作者：童燕群 | 发布日期：十月 21, 2020 | 阅读次数（6,701） | 评论

最近把NAS上面累积下来的音乐都整理了一下，用emby建了一个音乐集。emby自带musicbrainz的插件，能从这个强大的音乐库中搜索MP3的元数据信息。然后从多个维度对音乐进行分类呈现。但是有个问题，很多MP3经过各个二道贩子编辑后，关键元数据信息都跟音乐本身没有任何关联了，因此自动搜索出来的元数据匹配存在一些问题，甚至有的MP3文件经过转码后，只剩下音乐本身，tag元数据全部丢失。只能人工填写，一两千个文件，逐一搜索排查可想而知难度有多大。找到了picard这个工具，可以自行匹配，然后没有匹配的再人工搜索，这样极大提高了准确率。比emby自动但是做了的错误的匹配要好的多。经过picard处理后的音乐文件再导入到emby中，就能准确识别歌手，专辑等信息，进而补充下载专辑唱片封面图等。

难得的是，picard在Win、Linux和Mac平台都能使用。对于Ubuntu 20，使用官方给出的命令很快就能安装成功：

1sudo add-apt-repository ppa:musicbrainz-developers/stable
2sudo apt-get update
3sudo apt install picard

软件界面截图：

导入/emby的效果：

(5.00分 - 1票)

Loading ... | 同时归档在：数码硬件, 移动互联, 软件技术 | 标签： Emby, Home-NAS, Picard, 多媒体管理 |

基于Dlib、Flask和Sqlite的人脸检测和识别服务

作者：童燕群 | 发布日期：十月 7, 2020 | 阅读次数（1,403） | 评论

这个十一原定的计划取消了，没有做好备份计划，也就不打算出远门了，关在家里，把一直都想做的一个本地化的人脸识别服务整了一下。提供人脸分析的开源服务似乎很多年都没有大的变化了，一直都是Dlib和OpenCV，对比了一下，Dlib更容易使用。一直没有正经写过Python代码，翻出N年前买的Python编程书，边翻书Google、边写代码。基本的代码流程比较简单，Dlib官方也有例子，很容易运行起来，但是要服务化，要做人脸比对，并且是增量的人脸比对和识别，并不容易。说做就做，最终整个服务形成如下架构。

架构图：

代码和部署使用方法在如下git工程：https://git.codefine.site:3000/Shentar/facerec

首先需要将探测的过的“人脸”存储起来，然后能输入一张人脸返回与该人脸近似的所有人脸，这样客户端好做人脸归集。很快做好了一个初步的框架：使用Flask提供REST接口接收照片，在响应中返回人脸的特征标识，使用SHA256对人脸68点位的描述向量进行HASH，返回给客户端。同时将HASH值和实际的token存储到Sqlite。第一天大概就完工了这个功能。

运行起来，发现单纯的Flask不能并发，第二个请求会报错，一次只能接受和处理一个请求。于是又按照网上的经验，使用Gunicorn和Gevent来做多线程的方案，因为习惯了单进程多线程的方式，多线程访问Sqlite需要加锁，按照通用的做法，使用一个队列来管理Sqlite实例。继续验证，发现多线程并不能加速Detect的效率，貌似Dlib不支持多线程加速。调整为多进程，四个CPU都能运用起来。

终于找到了一个能将这个3.2GHZ的四核CPU跑满的业务了 ^_^

Architecture: x86_64

CPU op-mode(s):                  32-bit, 64-bit

Byte Order:                      Little Endian

Address sizes:                   39 bits physical, 48 bits virtual

CPU(s):                          4

On-line CPU(s) list:             0-3

Thread(s) per core:              2

Core(s) per socket:              2

Socket(s):                       1

NUMA node(s):                    1

Vendor ID:                       GenuineIntel

CPU family:                      6

Model:                           94

Model name:                      Intel(R) Core(TM) i3-6100T CPU @ 3.20GHz

人脸检测的效果还不错，错误率的话，自己家用是够了。特别是在侧脸检测上面，比较准确。在人脸比对方面，错误率就要高一些了，反复验证，发现0.36的比对阀值比较合适。侧脸虽然检测率高，但是在比对上面，只用通用的拟合范数，结果会表现为差异很大。因此这里应该是需要有定制化的比对实现，只做部分比对。这块需要深入到人脸检测技术内部，去分析128D的特征值向量的每一个值，短时间内没办法去研究透了。

由于采用了多进程，因此没法共用一个Sqlite运行时实例，强行并发读写访问会导致数据库错乱，不得不又做了一个服务来封装Sqlite，多个检测进程输出的人脸特征值都发给该服务来顺序存储，同时也返回给客户端。两个服务之间同样采用REST接口交互。

准备大规模上量，将jAlbum目前使用的线上人脸识别服务切换到这个本地服务上面，又发现检测时长非常高，一张4M的图片，大概需要几秒的时间，并且还有些非常小的区块被检测到了。对于检测慢的问题，考虑降低输入的照片的像素，图片减小后，长宽的像素点都相应减少了，但是人脸的特征点并不会损失太多。因此先对图片进行降低像素和尺寸，识别完成后，对识别到的人脸在照片上的位置也要相应做缩放，对比了一下，原始大小检测和缩放后检测，再对结果做相反的缩放，最终结果误差不大，但是这样能极大提速。对于非人脸和质量不高的人脸被检测到的问题，做了一些粗浅的限制，人脸长宽必须大于100的阀值才认为是正常的人脸。Dlib应该有正统的输出人脸的质量的参数，查了很久，没有找到合适的方法，就只能先这样吧。在比对方面，还有一些重要的概念，没有弄明白，如人脸对齐、年龄、性别检测等，不清楚我的代码里面是否已经有调用已经做了这块。

具体的处理代码：

01data = np.frombuffer(data, np.uint8) 
02if data is None: 
03    raise Exception('image is required.') 
04 
05zoom_ratio = 1
06if data.size > 6 * 1024 * 1024: 
07    img = cv2.imdecode(data, cv2.IMREAD_REDUCED_COLOR_4) 
08    zoom_ratio = 4
09elif data.size > 4 * 1024 * 124: 
10    img = cv2.imdecode(data, cv2.IMREAD_REDUCED_COLOR_2) 
11    zoom_ratio = 2
12else: 
13    img = cv2.imdecode(data, cv2.IMREAD_COLOR) 
14 
15faces = [] 
16dets = detector(img, 1)