分类目录：软件技术

软件编程技术，语言基础，算法数据结构。

3FS Usrbio 简介
NVIDIA 为 CUDA 添加原生 Python 支持：开启 GPU 计算新篇章
pico.sh服务简介
cloudflare的妙用
介绍一个生产力工具：ntfy
困扰了快1个月的家用宽带网络卡顿问题-Linux病毒实战手记
HomeServer 2024升级计划
HomeServer直播、监控方案实践
HomeServer安装在线Office：Docker安装最新精简版OnlyOffice
开源好用的电子书管理服务Talebook（Calibre网络版）安装使用指南

3FS Usrbio 简介

作者：微桐 | 发布日期：四月 6, 2025 | 阅读次数（3） | 评论

3FS 是一个为 AI 训练设计的分布式文件系统，USRBIO 是其原生客户端的关键功能。研究表明，usrbio 允许用户态应用程序直接提交 I/O 请求，绕过内核和 VFS，提升性能。它使用 Iov 作为大型共享内存进行零拷贝读写，Ior 则像 Linux 的 io-uring，处理批处理 I/O 请求。USRBIO 通过零拷贝和异步 I/O 减少开销，特别适合高吞吐量场景，如 AI 数据处理。

传统的FUSE客户端与服务端的数据交互流程为：

FUSE 操作示意图 — 图片源自：https://juicefs.com/zh-cn/blog/engineering/fuse-file-system-design

可以看到数据流在内核和用户态之间要反复拷贝才能传递到应用中。而3FS的USRBIO则卸载了数据流，直接通过3FS的SDK从远端拉取数据，结合RDMA等高效网络，做到了零拷贝。

picture.image — 图片来源：https://developer.volcengine.com/articles/7480397583173877797

总的来说，USRBIO 通过以下方式提升了 I/O 性能：

零拷贝 I/O：通过共享内存 Iov，数据无需在用户态和内核态之间拷贝，减少了内存拷贝开销。
批处理 I/O 请求：Ior 允许一次性提交多个 I/O 请求，减少系统调用次数。例如，设置 io_depth=1024 可以批处理 1024 个请求，显著降低上下文切换开销。
异步 I/O：应用程序可以继续执行其他任务，而不必等待 I/O 操作完成，提升了并发性能。
高性能网络支持：Iov 内存注册为 InfiniBand，支持 RDMA 等高性能网络传输，特别适合分布式 AI 训练场景。

这些特性使得 USRBIO 特别适合需要高吞吐量和低延迟的 AI 工作负载，例如处理 PB 级数据集的排序任务（如 GraySort 基准测试，3.66 TiB/分钟吞吐量）。

参考链接：
https://developer.volcengine.com/articles/7480397583173877797
https://zhuanlan.zhihu.com/p/30602759754
https://github.com/deepseek-ai/3FS/blob/main/docs/design_notes.md
https://github.com/deepseek-ai/3FS/blob/main/src/lib/api/UsrbIo.md

(5.00分 - 1票)

Loading ... | 同时归档在：AI技术, 存储技术, 架构设计 | 标签： 3FS, FUSE, 人工智能, 基础设施, 存储, 文件系统 |

NVIDIA 为 CUDA 添加原生 Python 支持：开启 GPU 计算新篇章

作者：微桐 | 发布日期：四月 5, 2025 | 阅读次数（6） | 评论

引言

在最近的 GTC 大会上，NVIDIA 宣布为其 CUDA 工具包引入原生 Python 支持，这一举措可能彻底改变 Python 开发者使用 GPU 计算的方式。作为全球最流行的编程语言之一，Python 在数据科学、机器学习和科学计算领域的广泛应用促使了这一更新。NVIDIA 此举不仅降低了 GPU 编程的门槛，还可能进一步推动其在全球开发者社区中的普及，尤其是在印度和巴西等发展中国家。

背景

CUDA 是 NVIDIA 推出的并行计算平台，旨在加速各种计算任务。自 2020 年以来，CUDA 的用户数量从 200 万激增至 2023 年的 400 万，显示出其在开发者中的日益重要性。与此同时，根据 GitHub Blog: Octoverse 2024 Analysis 的数据，Python 在 2024 年超越 JavaScript，成为最受欢迎的编程语言。这一趋势为 NVIDIA 提供了契机，通过整合 Python 支持来吸引更多开发者，尤其是那些习惯使用 Python 进行数据分析和 AI 开发的群体。

CUDA Python 的新功能

NVIDIA 为 CUDA Python 引入了一系列新功能，旨在提升开发效率并简化 GPU 编程：

即时编译（JIT Compilation）
JIT 编译减少了代码的依赖性，使开发者能够更轻松地管理和部署项目。通过在运行时动态编译代码，这一功能还能提升性能，减少对预编译二进制文件的需求。
CUDA Core
被描述为“Python 风格的 CUDA 运行时重新设计”，CUDA Core 为 Python 开发者提供了更直观的接口来管理 GPU 资源。这对于不熟悉传统 GPU 编程的用户来说尤为友好。
NVMath Python
该组件统一了主机（CPU）和设备（GPU）的库调用，简化了跨架构的代码开发。对于需要在 CPU 和 GPU 之间切换的应用程序，这大大提高了开发效率。
cuPyNumeric
cuPyNumeric 是 NumPy 的 GPU 加速替代品。根据 NVIDIA Developer: cuPyNumeric Overview 的介绍，开发者只需更改 import 语句，就能将现有的 NumPy 代码迁移到 GPU 上运行。这一功能基于 Legate 框架，支持从单 CPU 系统扩展到多节点多 GPU 集群，特别适合处理大规模数据集的研究人员和数据科学家。
CuTile
CuTile 是一种专注于数组级处理的新编程模型，旨在简化 GPU 计算的编码和调试工作。目前它主要为 Python 开发，未来计划扩展到 C++，以覆盖更广泛的开发者群体。

技术细节与支持库

CUDA Python 还包括一些增强功能的组件：

cuda.core：提供对 CUDA 运行时和核心功能的 Python 风格访问。
cuda.bindings：为高级用户提供对 CUDA C API 的低级 Python 绑定。
cuda.cooperative：支持高效的并行算法，如排序、扫描、归约和变换。
cuda.parallel：为 Numba CUDA 内核提供 CUB 的块级和线程级原语。

此外，nvmath-python 提供了 CPU 和 GPU 的数学库支持，进一步丰富了科学计算的生态系统。

潜在影响

这一更新有望显著降低 Python 开发者使用 GPU 的门槛，尤其是在数据科学、人工智能和科学模拟等领域。cuPyNumeric 使 NumPy 代码无需大幅修改即可扩展到 GPU 集群，这可能彻底改变研究人员处理大规模数据问题的方式。例如，计算流体力学、机器学习模型训练和高能物理等应用都将受益于更快的处理速度。对于发展中国家而言，Python 的易用性结合 CUDA 的强大性能，可能推动高性能计算资源的普及。NVIDIA 的这一战略不仅提升了开发者的生产力，还可能在全球范围内激发更多创新。

结论

NVIDIA 为 CUDA 添加原生 Python 支持是对 Python 在计算领域日益增长需求的积极回应。通过引入 JIT 编译、CUDA Core、NVMath Python、cuPyNumeric 和 CuTile 等功能，NVIDIA 不仅简化了 GPU 编程，还扩大了其潜在用户群。这一发展有望赋能新一代开发者，尤其是发展中国家的技术人才，让他们能够利用 GPU 的强大能力开发尖端应用。随着生态系统的不断完善，例如 CuTile 未来对 C++ 的支持，GPU 计算的普及性和多功能性将进一步提升。

参考资料

(5.00分 - 1票)

Loading ... | 同时归档在：AI技术 | 标签： CUDA, Python, 人工智能, 英伟达 |

pico.sh服务简介

作者：微桐 | 发布日期：四月 4, 2025 | 阅读次数（11） | 评论

服务简介
pico.sh 似乎是一个为开发者提供快速原型设计和分享项目的平台，主要通过 SSH 驱动的服务实现，无需安装额外软件。它的主要功能包括托管静态网站、运行本地 Web 服务、数据流传输、博客服务、RSS 邮件摘要和代码片段上传。

网站用途
pico.sh 的目的是帮助开发者利用 SSH 工具（如 rsync、sftp、sshfs）轻松地在网上原型设计和分享项目。它旨在简化分享过程，适合熟悉 SSH 的开发者。

主要功能
以下是 pico.sh 的核心服务：

pages：通过 SSH 在全球平台上托管静态网站。
tuns：通过 SSH 在本地主机上托管公共 Web 服务。
pipe：通过 SSH 的认证 *nix 管道在计算机之间传输数据。
prose：通过 SSH 提供博客服务。
rss-to-email：通过 SSH 接收 RSS 订阅的邮件摘要。
pastes：使用 rsync、scp、sftp 上传代码片段。

此外，平台自动处理网站和自定义域名的 TLS，并支持通过 SSH 和文本用户界面（TUI）进行管理。这可能对需要快速部署项目的开发者特别有用，尤其是那些已经熟悉 SSH 工具的用户。

pico.sh 是一个专为开发者设计的平台，旨在通过 SSH 驱动的服务简化原型设计和项目分享的过程。它利用现有的 SSH 工具（如 rsync、sftp、sshfs），无需安装额外软件，使开发者能够高效地在网上发布内容。以下是详细分析，包括网站用途和主要功能点的深入探讨。网站用途的详细分析根据对 pico.sh 主页和相关页面的分析，pico.sh 的核心使命是“通过服务帮助开发者在网上快速原型设计”，其目标是“让开发者比以往任何时候都更容易与世界分享他们的项目”。它通过 SSH 提供各种服务，强调无需额外安装软件，这对于熟悉 SSH 的开发者来说尤其方便。例如，平台支持使用 rsync、sftp 和 sshfs 等工具，开发者可以直接利用现有系统环境进行操作。此外，平台的动机似乎与“激进实验”（如 RFC-001 激进实验所述）有关，强调创新和实验性，这可能吸引那些寻求新工具的开发者。从“入门”页面（Getting Started）的信息来看，使用 pico.sh 需要先创建账户，通过 SSH 进入 TUI 控制台，提供用户名即可完成注册，用户名会用于服务域（如 glossy.prose.sh）。这进一步确认了平台以 SSH 为中心的操作模式，适合技术熟练的开发者。主要功能点的详细分析pico.sh 提供了多种服务，每个服务都有特定的功能，下面通过表格总结其主要功能点：

服务名称	描述	操作方式	额外特性
pages	在全球平台上托管静态网站	使用 rsync、sftp、scp 上传文件	自动 TLS、自定义域名、项目分析、SPA 支持
tuns	在本地主机上托管公共 Web 服务	通过 SSH 隧道访问，如 ssh -R dev:80:localhost:8000 tuns.sh	自动 TLS、HTTPS 访问
pipe	在计算机之间通过认证的 *nix 管道传输数据	使用 SSH 管道	安全数据流传输
prose	通过 SSH 提供博客服务	使用 scp 发布文章，如 scp hello-world.md prose.sh:/	博客管理
rss-to-email	接收 RSS 订阅的邮件摘要	使用 SSH 配置，如 scp blogs.txt feeds.pico.sh:/	邮件通知
pastes	上传代码片段	使用 rsync、scp、sftp，如 git diff	ssh pastes.sh changes.patch

这些功能通过 SSH 实现，强调了平台的轻量化设计。例如，“pages”服务不仅支持静态网站托管，还包括 Github Action、促销/回滚支持、自定义域名和重定向等高级功能（详见 pages 服务页面）。而“tuns”服务允许开发者通过 SSH 隧道将本地 Web 服务公开，适合快速测试和分享。此外，平台自动处理 TLS，确保网站的安全性，这对需要自定义域名的用户特别有用。从搜索结果和相关讨论（如 Hacker News 上的评论，pico.sh – SSH 驱动的开发者服务）来看，用户对定价（如 2 美元/月的低成本）表现出兴趣，这可能进一步降低了使用壁垒。然而，这些讨论未直接影响功能点的分析，主要用于确认平台的受欢迎程度。额外发现和上下文在分析过程中，还发现了与平台使用相关的细节。例如，“pages”服务提供免费层（25MB 存储限制），适合小型项目（详见 pages 服务页面）。此外，平台支持通过 SSH 命令管理所有服务，如缓存清除（ssh pgs.sh cache project-name）或访问控制（ssh pgs.sh acl project-x –type [type] –acl [value]），这增强了其灵活性。FAQ 页面（FAQ）提供了更多技术支持信息，如 SSH 密钥配置和登录问题解决，表明平台注重用户体验。值得注意的是，搜索结果中也出现了与 Raspberry Pi Pico 相关的条目（如 Tom’s Hardware 文章，如何设置和编程 Raspberry Pi Pico），但这些与 pico.sh 无关，可能是名称相似导致的混淆，已排除在外。综合评估pico.sh 适合需要快速部署和分享项目的开发者，尤其是那些熟悉 SSH 工具的用户。其主要优势在于轻量化、无需额外安装和强大的 SSH 集成，但可能对新手开发者稍显复杂。功能点的多样性（如静态网站托管、博客服务和代码分享）使其成为多功能平台，特别适合技术社区中的实验性项目。

关键引文

(5.00分 - 1票)

Loading ... | 同时归档在：WEB网络, 移动互联, 软件应用 | 标签： pico.sh, rsync, sftp, ssh, 博客 |

cloudflare的妙用

作者：童燕群 | 发布日期：一月 11, 2025 | 阅读次数（42） | 评论（1）

对于个人玩家，cloudflare免费计划有一些有趣的功能。如：免费的DNS托管，流量代理。基于这两项衍生出来的自动生成TLS证书，服务非标端口转发，Worker反向代理等。其中最有用的还是流量代理。之前一直是使用阿里云的ECS+备案来搭建本站的。在发现cloudflare的代理能力之后，果断将阿里云ECS停止续费了。实际也是续费到后面，价格越来越高，对个人用户而言，为了维持公网上面的几乎无访问量的博客，每年几百到一千的续费太奢侈。

将域名托管到cloudflare后，配置流量代理，然后博主本地电信宽带本来就提供公网IP，直接申购域名+家用HomeServer+cloudflare就能搭建一个标准的WEB服务。在本来就24小时开机的HomeServer基础上，实现了免费博客托管。现在本站即托管在家用服务器了。

用了一段时间发现，cloudflare的IP会被connection reset/refused，这应该由于某些已知的不可抗原因导致的。进一步发现cloudflare的几千个IP地址都是同样可以用来做代理转发流量的，只是cloudflare的免费计划没有提供自主选择IP的方式，需要一些hack手段。比如：如果是桌面操作系统主机，则可以自行配置Hosts文件指定IP地址（官网也提供了可用IP列表），当前本站即处于时而能访问时而不能访问的边缘。这对我个人写博客看博客而言，没有什么影响，对外部客户端访问本站有很大问题，远不如备案+ECS稳定，网速也差得远，因为cloudflare的代理IP都在国外，在国内访问本站，相当于流量从本地转发到国外，再绕回来，这样时延都是秒级，体验很差，但是能免费托管，还要啥自行车：）

有时候，由于出海需要，也要申请国外的VPS，这样可以用cloudflare的庞大IP地址集的代理能力做一个稳定的流量通道。要达成自主选择IP地址的目的，一个可以指定解析结果的DNS服务器就必不可少，在内网，可以使用dnsmasq+dhcp指定内网设备的解析结果。但是经常我们在外面，需要使用移动网络，这个时候，就没法访问内部的dns服务，同样，是桌面系统还好，能指定，手机呢？android系统有个配置私密dns的能力，必须是支持DoT或者DoH的dns服务器，并且该服务的地址要有自己的域名。查询chatgpt，给出了dnsmasq+stunnel的方案，进一步问到了把这个服务做成docker镜像的Dockerfile写法。按照给出的配置和打包流程，做成了镜像放到dockerhub上面了：链接。

上面提供了一些思路和大致的玩法，很多东西没法描述到太细，有了一个稳定的流量代理，大家可以充分发挥想象去做一些有趣的访问应用。最后给出一个HomeServer+cloudflare+外部VPS的连接示意图：

(5.00分 - 1票)

Loading ... | 同时归档在：建站技术, 移动互联, 软件应用 | 标签： cloudflare, Home-NAS, Home-Server, VPS, 建站 |

介绍一个生产力工具：ntfy

作者：童燕群 | 发布日期：十二月 24, 2024 | 阅读次数（46） | 评论

之前为了监控家里的IP地址的变化，写了一个循环任务，每隔几秒钟访问一次ifconfig.io，获取大网IP，当发现IP地址变化时，通过mailgun发邮件到自己邮箱，用这种方式感知到IP地址变化，同时也使用域名提供商的域名解析接口刷新IP地址。这个邮箱通知的方式有点偏重，并且mailgun随时有被墙的风险。最近开始接触虚拟币投资，发现虚拟币的波动大，适合短线交易。合约支持看空和看涨，因此只要有交易量，价格有波动则适合买卖，当然能否踩准加仓和平仓的波峰波谷才是关键。对于我这样每天并不能随时看盘的上班族而言，希望有个后台监控任务，识别已经仓位变化，变化幅度大时通知到手机。全网搜刮，找到了ntfy这个应用，支持自托管，有域名即可。用docker部署了，然后也下载了官方提供的android app，设置app后台常驻，使用方法也相当简单。直接上代码：

class Notify:
    def __init__(self, endpoint, user, password):
        self.auth_header = "Basic " + base64.b64encode(
            (user + ":" + password).encode("ascii")
        ).decode("ascii")
        # Remove trailing slashes
        while endpoint.endswith('/'):
            endpoint = endpoint[:-1]
        self.endpoint = endpoint

    def notify(self, title, msg, subject):
        if len(self.endpoint) == 0:
            return

        hostname = socket.gethostname()
        msg += f" (from {hostname})"
        res = requests.post(self.get_endpoint(subject),
                            data=msg,
                            headers={
                                "Title": title,
                                "Authorization": self.auth_header
                            })
        if not res or res.status_code != 200:
            logging.error(title)
            logging.error(msg)
            logging.error(str(res.status_code) + ":" + str(res.content))

    def get_endpoint(self, subject):
        if subject.startswith('/'):
            return self.endpoint + subject
        else:
            return self.endpoint + "/" + subject

然后就是调用币安的API SDK代码，请求账号的仓位信息，发现仓位变化量达到一定幅度时发通知。区分盈利和亏损，手机app上面分别订阅盈利和亏损的topic，设置不同的提示铃声，随时感知仓位变化信息，必要时进行平仓和加仓。

后面基于这个代码继续丰富这个后台任务的逻辑，走上虚拟币量化之路。

(5.00分 - 1票)

Loading ... | 同时归档在：WEB网络, 实用脚本, 数码硬件, 移动互联 | 标签： BTC, 比特币, 虚拟币, 量化交易 |

困扰了快1个月的家用宽带网络卡顿问题-Linux病毒实战手记

作者：童燕群 | 发布日期：四月 21, 2024 | 阅读次数（248） | 评论

最近一段时间家里领导反馈网络经常慢，之前还没太在意，上周反馈给电信，电信小哥直接给换了光猫。观察了几天，仍然间歇性的卡顿。尝试换路由器，换光猫拨号，都没有彻底解决。今天发现homenas流量异常，经常跑出大于电信宽带规格的带宽，家里宽带规格是300Mb的，上行更是只有50Mb的，怎么能跑出1000Mb带宽的数据量，很像是局域网的访问行为，这个带宽看起来很像家用磁盘的规格。压根没往外网流量上面想。查各种监控，都只有带宽和流出数据量的统计，找不到哪个进程或者业务。尝试atop，ntop，iftop，netdata，nethogs各种监控，都看不到流量哪里来的，更别说netstat了。最后只能tcpdump持续抓包，找到了一些线索。

大量从本机发出去的syn包，syn flood攻击，只是我的nas是攻击方，被拿来做“肉鸡”了。只发出了syn包，netstat看不到连接，还是我敲命令的时候，攻击已经停了，应该是前者，攻击的时候，登录在控制台界面也看不到连接。发现所有的网络统计工具都不显示只发了syn包的连接。syn攻击在工作中经常听到，但是很少有机会去实地解决，前端的防护设备帮挡住了，没想到在家用设备上面遇到了。

进一步找系统日志，有提示被攻击，应该是对端回应syn的包被系统识别为攻击请求直接拒绝了。

第一天就先查到这里了，担心NAS上面的数据被破坏，也先保家里的网络，关机收工。留下了几个疑点：
1，能跑出80MB上行带宽，远大于5MB，说明电信在这种攻击报文的带宽统计有缺陷，拦不住。当然syn包是否都出了光猫，发到了目标端，还是存疑的；
2，操作系统能拦截外面进来的攻击行为，不知道有没有拦截本机外发攻击包的行为；
3，根因应该是nas上面docker滥装，没有考证安全性，被留了后门，或者某个软件有已知的漏洞，被利用了。空了再找吧。

第二天上午，小心翼翼的开启NAS，继续分析头一天的抓包和系统日志。

试图从日志搜索攻击目标端的IP地址是什么时候注入的，无果。然后逐行分析日志，将重复的UFW日志过滤掉。可以发现有两条Cron的日志一直在打印：

这条 /.mod的日志特别显眼，之前就看到过这个日志，没有联想到系统的异常流量，因此觉得就是系统的例行任务。现在仔细看这个文件，是放在根目录的，之前没去分析过这条记录的含义，没注意放在根目录。一般可执行的命令怎么会放在根目录？赶紧去根目录找这个文件，使用ls命令，居然是返回的空，没见过这种，大概率是修改了文件属性之类的，继续使用stat命令，就发现异常了。文件是3月30号创建的。考虑这个文件每分钟都在执行，那我手动执行一次也无妨。使用strace跟踪执行过程，发现这个可执行文件会去打开/usr/lib/libgdi.so.0.8.2这个文件，然后看起来是直接执行这个文件。这是so文件，怎么会可执行呢？病毒无疑了。后面去打开这个文件，才发现是一个脚本。比我想象的简单多了，相当于分析了一下shell脚本执行时的strace，:-(

看到这里震惊了，Linux系统出现病毒文件，并且还能对外发起syn flood攻击。一下子就明了了。这个so文件也是3月30号创建的，然后也尝试执行了一下，strace日志比较复杂，有大量的网络操作。剩下的就没细看了，直接Google，找到了非常接近的介绍：Linux.Siggen.5802，按照这里给的列表，逐一确认是否病毒文件，逐一删除，并清理掉病毒生成的Cron任务。

最后还想找到3月30号系统是如何安装上这个病毒的，找了系统日志，没有发现太大的异常，不知道跟下面这个是否有关系，好像早先折腾过UI界面的桌面环境，不知道是不是当时下载了非标的安装包带入的：

不管了，这个也一并卸载了。

最后网络终于恢复宁静了。总结一下，就是syn flood包把光猫或者路由器的带宽和连接资源耗尽，然后NAS自己的网络也占满，最终导致终端上网异常。我是在NAS上面部署了dnsmasq作为局域网的解析，因此有时候还表现为终端能用聊天软件，而不能打开网页。

其实中途，一度怀疑新买的Wifi6路由器不稳定，考虑弄一个二手的企业路由器拨号看看，找到了tplink r473g，还打开了调试模式，登录到路由器的shell里面，尝试用top+nc，把实时的top命令结果传出来，最终也确实有所发现，就是当网络异常时，路由器的CPU是满的，然后CPU用在soft irq上面，就是在不停的响应网络中断，看到这里也没什么头绪。当时就想在路由器上面抓包，但是busybox系统没有默认带这个，也没有curl等命令能把抓包数据传出去，难度有点大，就先放弃了，直到这周五发现HomeNAS经常有流量尖峰，才朝着HomeNAS上面去定位流量异常的这个方向走。最早是考虑局域网内的终端访问NAS带来的，逐个排查是哪个终端导致的，甚至二分法逐一关闭容器，都无果。最终还是抓包+系统日志找到了问题。HomeNAS上面，一般是用docker，很少安装不明二进制包，偶尔安装不明的来源的docker镜像。docker里面搞破坏应该很少能破坏宿主机。目前看来，这个病毒做得还不算绝，没有动系统文件，估计也怕jc抓。计算机世界的病毒跟自然界一样，都是希望跟宿主和谐共处，薅一点资源生存。以前只听说黑客利用系统漏洞，做一些攻击，也一直认为Linux很安全，没什么病毒。第一次经历Linux系统被植入病毒木马，上了重要的一课。

附：一些定位过程中的命令
接收远端日志：(nc -l 12599 -k >> router_log.txt &)
路由器跟踪top：(top –n 1 –d 3 |nc –v 22.22.22.3 12599 &)，具体的循环任务忘记了，路由器的top没有打印时间，需要定时增加时间信息输出。
持续抓包：(tcpdump -i eno1 ‘not port 6870 and not port 22 and not port 443’ -s 96 -w all.cap -C 300 &)
iftop持续跟踪系统连接：(while :; do echo `date`>>iftop_all.txt; iftop -t -BNPn -s 10 -o 10s -i eno1 2>/dev/null >> iftop_all.txt; done &)
使用ntopng监控系统网络事件，使用iftop命令监控，跟Prometheus+Grafana的结果差不多，仅仅多了基于连接的统计结果。但是这种半连接过程的数据没有统计。

(5.00分 - 1票)

Loading ... | 同时归档在：WEB网络, 奇趣见闻, 数码硬件, 移动互联 | 标签： Home-NAS, Home-Server, linux, 计算机病毒 |

HomeServer 2024升级计划

作者：童燕群 | 发布日期：二月 11, 2024 | 阅读次数（174） | 评论

计划过完年升级一下HomeServer，主要是docker里面的容器越来越多，计算能力明显不足。有时候想做一些人工智能相关大模型的实验，跑不动，还有emby在播放高清视频时服务端解码能力不够，导致卡顿的问题。

已经忘记了上一次升级是什么时候，只记得全网搜寻多SATA接口的itx主板，除了那几个板载赛扬处理器软路由系列的，没有更合适的。退而求其次，考虑有个x16的pcie 3.0，然后插阵列卡或者转换卡，也能达到支持高规格CPU和多SATA接口的目标。考虑一个z270 itx的，能支持6、7、8代的CPU，有一个全速的pcie 3.0 x16插口，淘了微星贴牌海盗船的。然后就是各种配件依照规格下单：

lsi2308 SAS卡转4SATA接口线
ddr4 8GB*2
core i3 6100t（35瓦）
暴风影音4盘位itx机箱
1u电源

原来的SATA接口SSD重用

快递陆续到达后，装机，装系统，一次点亮，后面就是各种折腾docker，各种开源、自研软件部署。

想不到几年间，牙膏厂都挤到14、15代了。年前就在偶尔查新的itx主板，发现h610、b760和z690itx板都能支持12代，某些能刷BIOS后支持13代，且一般都有4SATA，2M.2接口，这就是一个标准4盘位NAS的要求啊。考虑将来继续升级，决定在b760和z690之间选，b760itx一般是ddr4，z690itx是ddr5的，当前ddr5内存价格是ddr4的两倍，性价比有点低。从主板本身价格看，在某鱼上面，二者相差不大，但新品差别很大，差不多贵1/3。是不是也有ddr5太贵导致z690的二手市场不活跃。CPU没有太多选择，只能是带t低功耗版本，考虑12600t，不知道超薄散热风扇是否够用。

考虑后面内存升级后还能用，最终决定还是咬咬牙上690itx，690itx+12600t+ddr5，12600t配这个主板是不是有点过于浪费了，就当升级预埋了，哈哈哈。原来的sas卡也就不需要了，系统整体功耗应该还会降一点。SATA SSD也用不了，还要补一块M.2的SSD。希望替换下来的6100t+微星z270itx+ddr4 8GB*2能顺利出掉，抵消一点升级成本。就这么愉快的决定了，修完春节长假就开整。

(4.50分 - 2票)

Loading ... | 同时归档在：数码硬件, 移动互联 | 标签： Home-NAS, Home-Server |

HomeServer直播、监控方案实践

作者：童燕群 | 发布日期：九月 28, 2023 | 阅读次数（255） | 评论

直播的基本原理是终端采集音视频流，推送到服务器，然后又由播放终端来拉取直播流。整体的数据流如下图所示：

图片来源于：https://juejin.cn/post/6844904179836813325

阅读全文 »

(5.00分 - 1票)

Loading ... | 同时归档在：数码硬件, 移动互联, 软件应用 | 标签： Home-Server, WEB网络, 互联网, 树莓派3, 监控, 直播, 视频监控 |

HomeServer安装在线Office：Docker安装最新精简版OnlyOffice

作者：童燕群 | 发布日期：十月 12, 2022 | 阅读次数（1,698） | 评论（1）

最近从这个帖子看到一些有趣的企业软件，其中有一个在线办公软件OnlyOffice，感觉挺有意思的。之前一直为各种自建网盘无法打开Office文档而烦恼，看到FileRun可以集成OnlyOffice DocumentServer，于是就决定开始搭建这个，解决自建网盘直接预览和编辑文档的问题。目前在用的3款网盘软件，还只发现FileRun支持，其他几款如FileBrowser、Cloudreve都还不支持。FileBrowser的Git库上面，有人提交了PR，但是迟迟没有被approve和合入。看起来挺简单的集成功能，不清楚开源owner为什么不合入。

第三方提供的界面总归还是有些不够专业，于是想着自己搭建一个完整的在线Office。经过一番摸索，需要DocumentServer+CommunityServer配合。前者只是一个文档查阅和编辑器，后者提供UI管理文档。当然也可以仅仅只搭建DocumentServer，用第三方的UI来集成，FileRun就算，还有更多的，笔者并没有作更多探索。这里的CommunityServer是一个复杂的办公Workspace，包括一系列的复杂的项目管理、团队管理等套件，这些套件全部包含在内，显得整个docker非常臃肿，资源有限的HomeNAS难以支撑，于是针对这个CommunityServer又做了一些裁剪，主要是把一些感觉用不到的进程停掉了，自己做了docker镜像，也上传到了dockerhub上面。下面开始介绍这两个组件的安装配置过程。

DocumentServer搭建很简单，毕竟依赖的组件少，官方docker镜像也非常简洁，很快就按照官方给的安装命令在HomeNAS上面跑起来了，并且简单配置之后就能在FileRun上面直接查阅和编辑Office文档了。但是发现一个问题，就是DocumentServer为了确保安全，默认启用了jwt_token。token确实有用，可以避免DocumentServer被盗用，被任意其他网络服务拿去使用耗费有限的资源，因此token是UI和Server之间通信的安全保障。有一个问题是，DocumentServer的jwt_token在每次DS重启之后就会重新生成，这样FileRun上面又要重新设置，经过分析，可以用Docker的环境变量指定一个固定的token。然后，如果没有指定外部DB，则DocumentServer会自己启动一个内建的mysql，这个mysql与已有的外部的mysql重复了，没必要，因此我选择使用外部的mysql来公用，节省资源。最终具体的运行命令如下：

docker run –net onlyoffice –name onlyoffice-document-server -d -p 127.0.0.1:12583:80 \
-e DB_TYPE=mysql \
-e DB_HOST=IP_OF_YOUR_DB_HOST \
-e DB_PORT=3306 \
-e DB_NAME=onlyoffice \
-e DB_USER=USERNAME_OF_YOUR_DB \
-e “DB_PWD=PASSWORD_OF_YOUR_DB” \
-e JWT_ENABLED=true \
-e “JWT_SECRET=YOUR_FIX_JWT_TOKEN” \
-v /your/app/path/DocumentServer/logs:/var/log/onlyoffice \
-v /your/app/path/DocumentServer/data:/var/www/onlyoffice/Data \
onlyoffice/documentserver:latest

上面只开启DS的http端口，同样使用系统统一的一个Nginx反向代理HTTPS对外提供服务。docker启动后，占用的资源非常少。具体的进程列表如下：

CommunityServer的安装过程就比较坎坷了，主要是想禁用多个暂时不需要的服务，笔者这里主要禁用elasticsearch、内部自带的mysql、还有一堆的Soauth、API、迁移数据、自动清理数据、备份数据、Chat服务等，感觉对于只想体验一下在线Office而言，这些都用不上，禁止之后也没有发现有什么地方运行异常，只用修改run-community-server.sh这个文件，然后重新打镜像即可。如果不做这个裁剪，我的四核6100T的CPU，16G内存，都非常吃力，并且还频繁崩溃重启。最终精简版的进程列表如下：

修改后的镜像我也上传到了，自己的dockerhub账号下：

https://hub.docker.com/repository/docker/shentar/onlyoffice-community-server

docker pull shentar/onlyoffice-community-server:latest

CommunityServer要使用token访问DocumentServer时，有点坑，找遍了各种设置界面都没看到，网上也没有任何资料介绍，最终在官方给的docker安装脚本中找到了，也是通过一个环境变量来指定。这样只要将该变量指定为DS的token即可。需要注意的是，CommunityServer也有自己的jwt_token，因此这两个都要指定，才能正常运转。具体的环境变量名为：

DOCUMENT_SERVER_JWT_ENABLED
DOCUMENT_SERVER_JWT_SECRET

最终，安装CommunityServer的命令为：

docker run –net onlyoffice -i -t -d –privileged –restart=always \
–name onlyoffice-community-server -p 127.0.0.1:12555:80 \
-e “MYSQL_SERVER_ROOT_PASSWORD=YOUR_MYSQL_PASSWORD” \
-e MYSQL_SERVER_DB_NAME=onlyoffice \
-e MYSQL_SERVER_HOST=YOUR_MYSQL_HOST \
-e MYSQL_SERVER_USER=YOUR_MYSQL_USERNAME \
-e “MYSQL_SERVER_PASS=YOUR_MYSQL_PASSWORD” \
-e JWT_ENABLED=true \
-e “JWT_SECRET=YOUR_FIX_JWT_TOKEN” \
-e “DOCUMENT_SERVER_JWT_ENABLED=true” \
-e “DOCUMENT_SERVER_JWT_SECRET=YOUR_FIX_JWT_TOKEN” \
-v /your/app/path/CommunityServer/data:/var/www/onlyoffice/Data \
-v /your/app/path/CommunityServer/logs:/var/log/onlyoffice \
-v /your/app/path/DocumentServer/data:/var/www/onlyoffice/DocumentServerData \
-v /sys/fs/cgroup:/sys/fs/cgroup:ro \
shentar/onlyoffice-community-server:latest

同样只开启HTTP，利用外部的Nginx来实现HTTPS反向代理，省去了一大堆SSL证书相关的事情。最终运行起来的效果如下图。测试了各项基本功能，都是正常的，精简掉的那些进程暂时用不着。

(5.00分 - 4票)

Loading ... | 同时归档在：WEB网络, 数码硬件, 移动互联, 软件应用 | 标签： Home-NAS, Home-Server, OnlyOffice, 在线Office, 移动办公 |

开源好用的电子书管理服务Talebook（Calibre网络版）安装使用指南

作者：童燕群 | 发布日期：四月 23, 2022 | 阅读次数（11,834） | 评论（132）

今天是世界读书日，介绍一款已经用过一段时间的电子书在线管理、阅读服务。Talebook是一个开源的Calibre WEB外壳，源项目地址是：Github项目，我为了方便自己开发，在自己的代码托管服务上放了一份源码，方便存放自己的开发过程代码。也经常将自己用稳定了的特性或者修改的Bug提交MR推送到原作者的项目中。我主要会根据自己的需要开发一些特性和修复我认为比较关键的bug。代码地址为：自用Talebook地址，Docker镜像地址。增加了多个特性，如：限制单个IP地址下载书籍的数量限制特性，用来防止爬虫大并发爬取书籍，导致站点不可用。另外还增加了一些统计信息和界面修改等，具体的差异点可以对比两个代码工程的获取。我也会持续跟进源项目的新特性，实时合并，也继续推送自己的修改到源项目。

更新记录列表：

支持限制单个IP地址下载数量；
支持随机推荐和最新书籍推荐手动刷新；
支持个人阅读、访问、下载和推送记录，也支持一键清除，优化历史记录页面；
新增“我的收藏”功能；
上传成功的图书即从upload目录删除，避免书籍被保存两份，浪费空间；
导入页面，在删除导入记录的同时，也删除上传到uploads目录的图书；
书籍页面新增豆瓣链接；
支持“分类导览”页面可定制，修改本地的data/books/settings/tags.yaml文件，然后重启容器即可；
支持添加“自定义运行脚本”，可以指定站点跟踪脚本；
支持批量删除数据、批量添加标签、批量抓取元数据；
支持流式加载PDF文件阅读。
支持批量抓取豆瓣元信息，并且批量确认和取消。配合shentar/douban_api:latest镜像使用；
“所有书籍”页面支持按照书名拼音排序。

跟原项目一样，我也基于仓库代码生成了镜像，推送到了dockerhub，有了Docker镜像，安装使用起来就非常方便：

docker run -d --name calibre \

-p 127.0.0.1:12579:80 \

-v /media/c2/docker/calibre/data:/data \

-E TZ="Asia/Shanghai" \

shentar/talebook:latest

我这里将容器内的80端口映射到本机的内部随机端口，然后再在宿主机上面使用Nginx反向代理对外提供HTTPS服务。反向代理时，需要注意一些配置：

server {

    listen 6870 ssl http2;

    server_name book.codefine.site;

    index index.html index.htm index.php default.html default.htm default.php;

    root /any/local/path/;

    ssl_certificate ***********;

    ssl_certificate_key ***********;

    ssl_protocols TLSv1 TLSv1.1 TLSv1.2;

    client_max_body_size 500M;

    location / {

        proxy_pass http://127.0.0.1:12579/;

        proxy_set_header Host $http_host;

        proxy_set_header X-Forwarded-Proto $scheme;

        proxy_set_header X-Nginx-Proxy true;

        proxy_set_header X-Scheme $scheme;

        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;

        proxy_set_header X-Real-IP $remote_addr;

        proxy_set_header Upgrade $http_upgrade;

        proxy_set_header Connection $http_connection;

    access_log on;

注意这些Header必须正确设置，否则可能无法正常打开主页。剩下的就是从网页打开宿主机的6870端口即可访问。我的宿主机是有域名的因此，我的站点的地址就是：https://book.codefine.site:6870，首次打开时，会做一些必要的配置，如私人模式还是多用户模式。admin账号和密码设置等。完成后就可以愉快的使用talebook存取电子书籍了。对于网络下载的各种电子书文件，元信息可能都不准确，因此需要从豆瓣等刮削元信息。开源社区有一个现成的刮削服务，douban-api-rs：源码地址为：https://github.com/cxfksword/douban-api-rs，这个也提供Docker的安装方式，不过作者并没有在Dockerhub上面放镜像。而是在Github自己的镜像服务上面托管镜像。如果是命令行安装，只需要执行如下命令即可：

docker run -d \

--name=douban-api-rs \

--restart=always \

-p 172.17.0.1:8080:80

ghcr.io/cxfksword/douban-api-rs:latest

~~如果是群晖等NAS服务，则需要自行配置新的镜像源才能拉去到该镜像。具体笔者没有使用过，需要自行探索。~~可以使用如下docker部署刮削服务，注意，本站的talebook镜像必须配套这个刮削服务，如果混用会有各种异常，或导致IP地址被豆瓣禁用。 https://hub.docker.com/r/shentar/douban_api，

docker run -p 172.17.0.1:12568:8080 --name douban_api --restart=always \
-v /your/data/volume/full/path/:/data \
-v /etc/timezone:/etc/timezone:ro \
-v /etc/localtime:/etc/localtime:ro \
-e LOG_LEVEL="warn" \
-e COOKIE='your douban login cookie' \
-d shentar/douban_api:latest

然后到Talebook的高级配置项目中配置即可：

我这里之所以选择使用172.17.0.1作为监听地址，是因为这个地址是我的docker服务的网络的虚拟网关，宿主机也能访问这个IP地址。这样，在Talebook内部就能用这个地址与豆瓣刮削服务通信。上传电子书之后，只要设置正确的书籍名字即可进行全量元数据的抓取了。豆瓣网站不再提供书籍的标签（Tag）了，因此Talebook服务端做了从作者、标题和书籍摘要中匹配Tag的实现，准确率还行。感谢Talebook作者贡献这么好的开源项目，并且多年来还在积极维护。这个项目也让我初步接触到Vue.js、Node.js、Python3 Tornado等生态，开发WEB项目，使用这些组件，效率极高。什么时候有精力可以把jAlbum的前端好好用这些写一下。

(5.00分 - 5票)