然而,这里出现了一个严重问题ai生成。传统的AI代码评测方法就像只看菜谱是否正确,却从不品尝做出来的菜是否好吃。现有的评测标准主要关注代码是否能跑通、逻辑是否正确,但完全忽略了最终呈现出来的界面是否美
˂imgsrc="http://www.seozhuji.com.cn/zb_users/upload/2025-07-14/687489c47a198.jpg"alt="同济团队:如何评估AI生