brepler流匹配编辑brep模型transformer B-repLer 能够实现高质量的 CAD 编辑主要归功于它将 CAD 的几何问题转化为了一个序列到序列的翻译问题并结合了两种核心技术潜空间 (Latent Space) 操作和流匹配 (Flow Matching)。以下是它的具体实现机制1. 在“潜空间”进行编辑 (B-rep Latent Space)B-repLer 不直接在原始几何如顶点、边上操作而是使用一个预训练的编码器如 HoLa-BRep将复杂的 CAD 模型映射到一个连续的潜空间中。避开历史记录:传统的编辑需要“建模历史”如先拉伸 A再切除 B但很多模型没有这些数据。B-repLer 直接处理最终的边界表示B-rep将每个面Face转化成一个 32 维的向量。保证有效性:潜空间经过训练使得即使向量发生微小变化解码出的模型依然能保持拓扑上的正确性水密性减少了生成废料的概率。2. 混合架构Transformer 流匹配B-repLer 的核心是一个变分自回归 Transformer它分为两个步骤来生成编辑后的模型步骤 A自回归预测Transformer它接收原始模型的向量、用户的文本指令和一张渲染图作为输入。Transformer 会一步步预测编辑后模型应该包含哪些“面”的特征。关键点:它预测的不是具体的坐标而是为下一步提供一个条件特征 (Conditioning Feature)。步骤 B精细几何生成流匹配对于每一个预测出的面B-repLer 使用流匹配网络 (Flow Matching Network)。这是一种比扩散模型Diffusion更快的生成技术。它从随机的高斯噪声出发在 Transformer 提供的“条件”指导下通过 100 个微小的步骤将噪声“推”向精确的 B-rep 几何参数。这保证了生成的几何体如 B 样条曲线具有工业级的精度。3. 多模态特征融合 (Multimodal Fusion)为了让 AI 听懂指令并看懂模型它做了以下对齐文本:使用 Qwen2.5 提取指令语义例如“把底部的孔去掉”。图像:使用 DINOv2 提取渲染图特征并利用RoIAlign技术将图像中的视觉信息“贴”回 3D 的每一个面上让模型知道指令里说的“这个面”具体长什么样。4. 大规模数据集支撑 (BrepEDIT-240K)为了教会模型如何编辑作者创建了 BrepEDIT-240K 数据集。他们利用自动化脚本对 CAD 模型进行增删改查。使用多模态大语言模型如 Gemini为这些修改自动生成复杂的文字描述包括功能性描述如“为了增加承重性能而加厚”。总结B-repLer 是通过Transformer 决定编辑逻辑再用流匹配网络打磨几何精度并在一个不依赖建模历史的潜空间中完成所有操作。这使得它能够处理复杂的自由曲面B-Spline而不仅仅是简单的方块和圆柱。