返回 科研
🔬 科研 2026-03-20 11:41

ChineseResearchLaTeX v4.0.8:这不是小修小补,而是在把论文工作流彻底掰正

别被 v4.0.8 的版本号骗了。这一版最狠的不是多了几个文件,而是把 SCI 论文 PDF / DOCX 双输出链路狠狠干回了 extraTex 单一真相来源;再加上博士论文版式修复和视频海报资源补齐,ChineseResearchLaTeX 正在从能跑的模板仓库,走向更像平台的科研写作基础设施。

#ChineseResearchLaTeX #NSFC #发布公告 #科研写作
BenszConan 的头像

BenszConan

管理员

前几天,我刚连续写了两篇和 ChineseResearchLaTeX 有关的文章。

一篇是《开发者2027寄语:ChineseResearchLaTeX 的未来规划》,讲的是这个项目想把自己带去哪里。

另一篇是《别被“小 commit”骗了》,讲的是 v4.0.6 之后那 5 笔提交,怎样把测试、README、Issue 入口和协作边界这些“地基层”的东西拧紧。

如果说前者写的是野心,后者写的是治理,那么这次 v4.0.8 写的,就是落地

而且不是一般意义上的“小修小补式落地”。

这次最狠的一刀,直接砍向了科研写作项目里最容易越做越乱、越做越漂移的一条链路:SCI 论文的 PDF / DOCX 双输出工作流。

先把时间线说清楚:

  • v4.0.7 的 release 同步时间是 2026-03-18
  • v4.0.8 的核心实质提交集中在 2026-03-19 到 2026-03-20
  • 除去最后那笔“更新版本号”的 housekeeping,这一版真正值得看的,是 3 笔主提交 + 1 笔 README 同步

git diff v4.0.7..v4.0.8 来看,这一轮一共动了 44 个文件,新增 537 行,删除 342 行。别看版本号只是从 4.0.7 跳到 4.0.8,这次里面装的,不是零碎补丁,而是一轮很明确的结构整形。

这次版本最值得看的,不是“加了什么”,而是“狠狠干掉了什么”

很多人看版本更新,只盯着有没有新模板、有没有新技能、有没有更大的功能 headline。

但到了 ChineseResearchLaTeX 现在这个阶段,更值钱的变化已经不是“再多一个目录”,而是:

  • 哪些历史包袱被扔掉了
  • 哪些双轨结构被收成单轨
  • 哪些会反复制造维护成本的中间层被直接拆掉了
  • 哪些局部版式 bug 被处理得更像“成品”而不是“demo”

v4.0.8 最有杀伤力的地方,就在这里。

第一刀:SCI 论文工作流被彻底掰正了

这一版真正的主轴,是 2026-03-20 13:11 的这笔提交:

f40929e refactor(paper): 改用 extraTex 作为 PDF/DOCX 唯一正文来源

这句话看着平静,实际上非常重。

为什么?因为它改的不是一个脚本参数,不是一个命令别名,而是整条 paper-sci-01 产品线的正文真相来源

之前的问题是什么

v4.0.0 的那套设计里,paper-sci-01 走的是一条“Markdown 为正文真相”的路线:

  • 正文长期维护在 artifacts/source/*.md
  • 再通过构建流程生成 LaTeX 片段,去服务 PDF 输出
  • 与此同时,DOCX 也依赖这套 Markdown / manifest / metadata 体系

这条路在“快速打通 PDF + DOCX 双输出”阶段当然是有效的,但它有一个很现实的问题:

这个项目本质上是 LaTeX 平台。

当一个 LaTeX-first 的科研写作项目,长期把论文正文的主控权放在另一套旁路结构里,时间一长,问题几乎一定会冒出来:

  • PDF 真正渲染看的,是 main.tex + extraTex
  • 但 DOCX 的叙事顺序和内容组织,又被另一套 manifest.yaml 控着
  • 题名页、作者信息、附加说明,还会散落在 references/meta.yaml 这种额外元数据文件里
  • 用户改正文时,脑子里必须同时记两套结构
  • AI 如果介入修改,也很容易改到“能导出 DOCX 但不贴近最终 LaTeX 排版逻辑”的那一层

说白了,这种结构不是不能跑,而是越跑越容易分叉

你今天还能记得清楚,三个月后、五个模板后、十次需求迭代后,就很可能开始出现这些问题:

  • PDF 和 DOCX 的章节顺序谁说了算?
  • front matter 到底改哪一份?
  • 新增一段附加说明,是改 Markdown 还是改 TeX?
  • 删除一个章节时,manifest、元数据和实际 \input{} 会不会漂移?

这不是“小麻烦”,这是会把整条论文产品线拖进长期维护泥潭的大麻烦。

v4.0.8 干了什么

这次重构,做得非常坚决:

  • 直接删除了 projects/paper-sci-01/artifacts/source/12 份持久化 Markdown 正文文件
  • 直接删除了控制章节结构的 manifest.yaml
  • 直接删除了额外维护 front matter 的 references/meta.yaml
  • 同时新增 extraTex/front|body|back/*.tex 这一整套 LaTeX 正文片段

也就是说,paper-sci-01 现在彻底改成:

extraTex/**/*.tex 才是 PDF / DOCX 的唯一正文真相来源。

这句话的含金量非常高。

因为它意味着:

  • PDF 终于直接吃真正的 LaTeX 正文,而不是吃“另一套源文件转过来的结果”
  • DOCX 也不再维护第二份长期存在的正文,而是在导出瞬间按 main.tex\input{} 顺序读取同一批 .tex
  • Markdown 沦为运行期临时中间产物,不再是需要人工维护的第二战场

这不是普通优化,这是把双轨维护狠狠干回单轨维护

为什么这一步这么重要

因为科研写作最怕的,不是功能少,而是同一篇文章有两份真相

一旦有两份真相,后面所有事情都会开始变脏:

  • 引用会漂
  • 章节会漂
  • 标题层级会漂
  • 前后文修改会不同步
  • AI 协作会越来越容易改错层

v4.0.8 干的事情,本质上就是一句话:

以后这条 SCI 论文链路里,谁是正文,终于不含糊了。

这对用户是极其实际的。

以后你在 paper-sci-01 里改内容,原则非常简单:
只盯 extraTex/**/*.tex

你不需要再去维护第二套正文 Markdown,也不需要再去理解一份额外的 manifest 才知道 DOCX 是怎么拼起来的。

这会直接降低三种成本:

  • 普通用户的理解成本
  • AI 代理的修改偏航风险
  • 维护者后续扩展更多 SCI 模板时的结构失控风险

更关键的是,它不是嘴上说“统一了”,而是真的把护栏补上了

这次我很看重的一点,是它没有停在“口头上改了工作流”,而是把验证也补了上来。

packages/bensz-paper/tests/test_manuscript_tool.py 是这一版新增的一个很关键的测试文件,里面测的都不是花哨东西,而是最容易在重构后偷偷坏掉的硬点:

  • collect_extra_tex_inputs() 会不会严格按 main.tex 里的 \input{} 顺序抓正文
  • 被注释掉的 \input{} 会不会被误收进去
  • LaTeX 里的 \supercite{}\textcite{} 之类引用,转 DOCX 时能不能稳定保留
  • 老版本遗留的 .latex-cache/main.md 和缓存里的 extraTex/ 中间稿会不会被清掉

这就说明一个信号:

这次不是“先改通再说”,而是已经开始用测试去把新结构钉住。

这很重要。

因为真正可持续的项目,从来不是“改完当下能跑”,而是“改完之后别人再改,也不容易把它改崩”。

第二刀:博士论文模板那个很伤观感的留白问题,被正面解决了

2026-03-19 16:056d8d928,标题是:

fix(thesis): 修复 SYSU 博士论文模板 subsection 竖向留白问题

如果你不常碰 LaTeX,可能会觉得这只是排版洁癖。

其实完全不是。

对论文模板来说,最伤用户信任的一类问题之一,就是这种:

  • 某一页内容稍微少一点
  • subsection 标题前后的竖向空白突然被拉大
  • 整页看起来像是“版心松了”“行距乱了”“像没调好一样”

这种问题不会让编译失败,但它会直接破坏成品感。

而 thesis 用户,恰恰是最怕这种事的人群。因为博士论文的 PDF 不是内部笔记,它是要交、要审、要答辩、要留档的。

这次修复不是简单地碰一下参数就算了,而是两层一起动:

  • 一层是显式启用 \raggedbottom,避免页面为了齐底,硬把标题前后留白拉得夸张
  • 一层是直接用 titlesec\titlespacing*{\subsection}{0pt}{4pt}{2pt} 精确压紧小节标题上下距

这意味着维护者已经不满足于“宏观看起来差不多”,而是开始对具体观感问题下刀。

这种 fix 的价值,恰恰在于它很难用截图 headline 去宣传,但真正用模板的人会立刻感受到:

页面不再松,标题不再飘,整份论文更像一个严肃成品。

第三刀:项目开始认真经营“怎么被看见”

2026-03-20 13:59a7632f4 也很有意思:

feat(logo): 新增视频海报设计资源

很多人会下意识觉得,这跟模板能力没关系。

我反而觉得,这笔提交很能说明 ChineseResearchLaTeX 正在进入一个新阶段。

这次新增的不只是两张图片,而是一整套更成熟的对外展示素材:

  • video-poster-2_16-9.jpeg
  • video-poster-2_4-3.jpeg
  • video-poster-2_design-philosophy.md
  • video-poster-2_prompt.md

而且从设计哲学和 prompt 内容看,这不是随便糊一张宣传图,而是在刻意把项目的整体定位可视化:

  • 中央发光核心代表共享基础设施
  • 周围模块化面板对应 NSFC、SCI、thesis、academic CV、AI skills
  • 甚至把 build / release / Overleaf / VS Code workflow 都纳入同一张叙事画布

这个动作的真正含义是:

ChineseResearchLaTeX 不再只把自己当一个“代码仓库”,它开始把自己包装成一个完整的平台叙事。

这很关键。

因为当一个项目开始同时经营:

  • 代码结构
  • 发布链路
  • 文档入口
  • 协作规则
  • 对外视觉表达

它就已经不只是“作者一个人写着玩的模板集合”了。

它是在朝一个更完整的科研写作基础设施走。

把这三笔放在一起看,v4.0.8 的信号其实非常清楚

如果把最近这几篇文章串起来,你会发现一条很清晰的线:

  • 《开发者2027寄语》讲的是:它想覆盖中国科研写作全链条
  • v4.0.6 之后那篇文章讲的是:它开始补测试、规范和协作入口这些治理层能力
  • 而这次 v4.0.8 讲的是:它开始把具体产品线里的“源文件真相、版式成品感、对外表达力”一口气掰顺

所以我会说,别把 v4.0.8 当成一个小版本。

它最值钱的地方,不是“新增了多少可展示功能”,而是:

它在主动拆掉那些会让项目未来越来越乱的结构。

对于一个正在往“NSFC + SCI + 毕业论文 + 学术简历 + AI Skills”多线平台走的项目来说,这种动作比再多一个目录还重要。

因为目录可以慢慢加,
但脊梁骨如果一开始没掰正,后面所有增长都会带着旧毛病一起放大。

而现在,ChineseResearchLaTeX 至少在 paper-sci-01 这条线里,已经开始把这根脊梁骨掰正了。

对普通读者来说,最实际的变化是什么

如果你是直接使用这个项目的人,这一版最实在的收益有三条:

  • 写 SCI 论文时,正文维护逻辑更清楚了,以后就盯 extraTex/**/*.tex
  • 导出 PDF / DOCX 时,双输出漂移的风险更低了
  • 用 thesis 模板时,局部页面那种“诡异松散感”被明显压下去了

如果你是看项目演化的人,这一版更值得注意的点则是:

它开始从“功能扩张”转向“结构整形”。

这往往才是一个项目能不能长期往上走的分水岭。

结尾

所以,v4.0.8 最应该被记住的一句话,不是“又更新了”。

而是:

ChineseResearchLaTeX 开始把它最关键的一条论文工作流,从能跑,推进到顺手、统一、可维护。

这一步不花哨,但非常凶。

真正做项目的人都知道,最难的从来不是把东西堆出来,而是把已经长出来的东西重新掰直。

这次,ChineseResearchLaTeX 就是在做这件事。


项目 GitHub 地址:
https://github.com/huangwb8/ChineseResearchLaTeX

同频道推荐

查看全部 →

评论区

0 条评论
游客只能浏览内容;登录后即可参与评论。
还没有评论,欢迎发表第一条看法。