廖力工作日志 2026-02-03 09:32:23 星期二

上周主线: 本来应该完成:1.完成脚本编辑界面的所有数据绑定的工作。2.完成中间文件管理的数据绑定工作。但由于一直在等接口所以实际上在做一些体验优化工作
本周主线: 完成工具2.0“生成创意”的搭建

##今天的任务:

1.完成脚本编辑器的小AI生成功能

2.给脚本编辑做一个前端删除

            已经完成,并且在删除后如果再打开任务,会提示“任务不存在或已被删除”
            --2026-02-03 10:44:01 星期二

3.继续优化对话流不吸底的问题

            现在已经找到问题根源
            问题根源是对话流吸低主要依赖接口响应
            在测试环境下接口响应非常快和及时所以吸低效果好
            但是在线上接口响应慢且不是特别及时,所以效果没有特别好,经常一卡一卡
            所以问题的关键就是不要去依赖接口更新而是界面的文字更新

            已经完成 ---2026-02-03 10:14:32 星期二

4.抽空研究一下混剪要怎么做

        智能混剪任务在工作台里的的要点就是
        如果提交了智能混剪任务
        就是可以将脚本生成 --》 智能混剪视频生成进行端到端交付(一条龙做完)
        和单独脚本生成的区别就是,脚本生成完,给个界面给用户进行脚本编辑,编辑好再确认要不要去进行混剪
        但是视频混剪任务的意思就是直接生成脚本,脚本生成完之后马上将脚本发到混剪那边去,执行混剪任务

        通过理解设计稿上的需求:
        用户在聊天对话中是可以直接根据上下文中生成的脚本生成混剪视频的,
        需要通过聊天流接口发起任务,而不是前端发起


        如果一定要前端来做,那么可能的做法是:
        三个入口:
        1.直接生成短视频(混剪) 在对话开始前就记录当前任务属性,并在脚本创建完成后直接发起混剪任务,并将混剪任务客片推到前端的对话流里去。
        2.脚本完成后,在脚本编辑器里直接点击生成短视频(发起混剪任务),前端做一个系统消息卡片放在聊天流里
        3.用户在对话流里发送类似“开始制作短视频”消息,前端直接用正则表达式匹配是否存在“制作”“短视频”等字眼,有的话直接通过接口发起混剪任务,并做一个对话卡片放在聊天流信息里。
        4.所有推送到前端消息记录里的混剪任务,都由前端使用轮训查询进度。

        问题:
        1.混剪任务的对话消息记录如何存储?


        最终结论是:
        视频混剪任务也要经过llm进行,而不是前端直接调用。
        需要通知ai那边的同学改接口

@朱德民 @韩奥 两位同学,还有个旧功能需要你们帮忙接上去,就是用户生成完了脚本之后,

在这个界面上,点击开始混剪的时候,前端会通过对话接口发出需要开始混剪的命令,然后需要你们那边通过“视频混剪任务创建接口”就是这个接口“POST /api/videoMashup”发起一个混剪任务。大概是这样的一个需求:
这个需求的实现细节是这样的:
1.参考1.0的对话接口(实际上有现成的代码,把逻辑接上就好了)
2.我会通过我们之前对好的chat接口发送:
{
“chatId”: “string”,
“userId”: 0,
“deId”: 0,
“jobType”: 0,
“jobId”: “string”,
“message”: “string”,
“extra”: {
“command”: “editScript”,
“script”: {adfadsfasdfa}
}
}
在 “extra”里,如果识别到了
command === “editScript”
就使用script里带过来的脚本发起一个混剪视频的任务(这个在旧代码里有,你们可以参考一下)

5.开始做混剪功能

6.完成混剪功能

7.鉴于混剪功能暂时需要更改接口无法展开,现在开始修复一下工作台v2的聊天体验:

        1.消息发送后->进入工作台的一瞬间,消息文本框的状态看起来非常奇怪。
            已经改进 --2026-02-03 14:36:02 星期二

        2.消息在输出时,已经切换了角色的消息还在播放打字机动画,看起来很怪。
            已经改进 --2026-02-03 14:36:10 星期二

        3.消息输出时,吸低效果不理想
            已经改进 --2026-02-03 14:36:17 星期二

        4.改进工作台v2对话流消息输出组件的代码结构,使其更节省渲染开销
            --2026-02-03 15:53:26 星期二


        改进了工作台一些列看起来古怪的交互

##明天的任务:

长期任务:
1.适配一个移动端版本
2.图片编辑模块的需求 — 延后
图片编辑模块的业务照搬美图秀秀,原因是美图秀秀提供的图片编辑功能可以用于图生视频的前置编辑
目前已有的大模块为:
调整 – 调整图像尺寸
抠图 – 获得前景
人像 – 人像美化
滤镜 – 一些照片风格滤镜

    2.1 了解图片编辑模块的子模块拆分是怎么做的

    2.2  了解图片编辑模块的代码风格

    2.3  了解图片编辑模块的单例模式实现和状态管理是怎么做的

    2.4   了解当前图片编辑模块缺失的内容有哪些
            1.调整模块
                    基础调整已经完成 但包含一些bug
                    没有高级调整功能


            2.抠图模块
            3.消除笔模块
            4.ai超清模块
            5.ai扩图模块
            6.无损放大模块

            总结,主要做调整和 抠图,人像和滤镜功能disable掉,暂时不做

    2.5   了解当前图片编辑模块为未来可以做哪些代码或结构上的优化
            1.当前图片编辑的模块配色没有使用色板
            2.当前图片编辑模块的尺寸没有使用rem导致尺寸在rem分辨率适配下失真
            3.界面需要对齐设计稿
                1.当前界面需要全屏显示
                2.当前界面的ui元素和设计稿不对齐
            4.目前一级菜单上的样式未对齐设计稿

设计稿规格为:1440*900

—————————————————————-其它内容———————————————————————–