1、提问者最好先搞清楚Tokenizer的工作,事实上<p><b></p>解析成什么DOM和Tokenizer没啥关系(HTML Tokenizer一般来说是只负责解析tag的)。
2、Tokenizer行为的确不一致,不过主要是一些没太大关系的属性粘连之类的小问题容错处理上(<a href="xxx"class=b>),对于tag的截取判断我目前没发现很大差异。
3、如果服务器端都解析DOM了,那么标准格式化输出HTML即可(譬如说<p><b></b></p>),任何浏览器的解释行为都会一致,除了HTML 5规范那个坑爹的<A>规则变迁(在HTML 5中,<A>可以包含block-level element,这一点导致解析行为和HTML 4不一致)。