contenteditable 仅提供基础编辑能力,不支持格式控制、撤销、安全粘贴等高级功能,适合轻量场景;真富文本需用 Slate/Lexical 等底层自研方案。
直接给元素加 contenteditable="true" 确实能立刻获得光标、选区、基础输入能力,比如改标题、填表单草稿。但它只提供 DOM 层面的编辑入口,不处理格式、撤销、粘贴净化、协作光标、历史记录这些——这些得自己补。
常见错误现象:document.execCommand 在现代浏览器中已废弃,且行为不一致;直接监听 input 事件拿不到格式变化(如加粗后删掉文字,样式残留);粘贴富文本时 HTML 被原样插入,可能带恶意 script 或乱样式。
contenteditable 元素上监听 mutationobserver 监控变化,容易卡顿HTML 是描述性标记语言,不是编辑模型。比如 hello 和 hello 在渲染上一样,但 DOM 结构不同,contenteditable 无法统一抽象为“加粗”操作。浏览器对同一语义(如“斜体”)会产出不同 HTML,导致保存/同步困难。
更麻烦的是:用户用 Backspace 删除一个 段落末尾,有些浏览器会把下一段合并进来,有些则留下空 ;拖拽图片插入位置不可控;execCommand('insertImage') 插入的 标签没有 alt,无障碍不达标。
),Firefox 更爱 + style
contenteditable 的 focus/selection API 支持残缺,getSelection() 常返回 nullinnerHTML 当“内容快照”——它含浏览器自动补全的标签(如
),和真实意图偏差大主流方案(如 Slate、Lexical、ProseMirror)都不直接用 contenteditable 当主容器,而是用它做“输入靶心”,所有编辑逻辑走自定义数据结构(如 JSON AST),DOM 只负责渲染,输入事件被拦截后转成命令再更新状态。
例如用户按 Ctrl+B,不调 execCommand,而是:捕获按键 → 计算当前选区对应节点路径 → 更新内存中的 schema → 触发重渲染 → 同步光标位置。这样格式、撤销、协同都可控。
const editorState = {
type: "doc",
children: [

{ type: "paragraph", children: [
{ type: "text", text: "hello" },
{ type: "text", text: "world", marks: ["bold"] }
]}
]
};
range.setStart() 易失效)、粘贴解析(event.clipboardData.getData('text/html') 需白名单过滤)、键盘快捷键映射scrollIntoView 失效,得用 scrollTo({ behavior: 'smooth' }) + 定时重试哪怕只要支持换行+粗体+链接,也会撞上:链接点击跳转与编辑模式冲突、双击选词触发浏览器默认菜单干扰、屏幕阅读器读不出“已加粗”状态、Ctrl+Z 在嵌套 contenteditable 中失效。
真正省事的方案,是明确需求边界。如果只需要用户改几段说明文字,用 textarea + Markdown 预览更稳;如果必须所见即所得,直接集成 tiptap(基于 ProseMirror)比魔改 contenteditable 少踩三个月坑。
最容易被忽略的一点:所有基于 contenteditable 的方案,都无法可靠支持 IME(中文输入法)在复杂嵌套节点中的光标同步——这是 Chromium 和 WebKit 长期未修复的底层限制。