欢迎来到涛涛聊AI,

我们在使用链接读取得到文本后,里面混杂了其他信息,今天咱们好好研究下。

一、获取的内容

插件获取到内容如下:

 "**标题:** 豆包搜索 AI搜索,抛弃广告,快人一步 AI搜索起飞了#ai搜索引擎 #豆包\n**作者:** 滔滔讲AI\n**视频ASR文本:** 以前咱们都是用某度搜索一大堆广告特别的烦人现在有了  ai 搜索就不一样了尤其是豆包的浏览器插件简直就是神助攻安装也特别简单登录豆包以后点击左下角等等相关技能赶快用起来吧\n**视频或图片OCR文本:** |aaaAI智能其他无用信息他无用信息他无用信息他无用信息他无用信息,这里面的内容是通过识别视频内容得到的,不是文案\n" 

也不换行,截图如下,但这并不是真实的内容,而是美化后的内容。

二、真实的数据内容

点击查看JSON后。

瞬间凌乱了。

三、通过代码节点搞定

通过上面的文本可以看出,字数不固定,一定需要正则表达式才能搞定。通过这一点我就确定程序员不会消失,哈哈,没写过程序的绝对蒙。

原始代码节点内容代码如下:

# 在这里,您可以通过 ‘args’  获取节点中的输入变量,并通过 'ret' 输出结果
# 'args' 和 'ret' 已经被正确地注入到环境中
# 下面是一个示例,首先获取节点的全部输入参数params,其次获取其中参数名为‘input’的值:
# params = args.params; 
# input = params.input;
# 下面是一个示例,输出一个包含多种数据类型的 'ret' 对象:
# ret: Output =  { "name": ‘小明’, "hobbies": [“看书”, “旅游”] };

async def main(args: Args) -> Output:
    params = args.params
    # 构建输出对象
    ret: Output = {
        "key0": params['input'] + params['input'], # 拼接两次入参 input 的值
        "key1": ["hello", "world"],  # 输出一个数组
        "key2": { # 输出一个Object 
            "key21": "hi"
        },
    }
    return ret

四、DeepSeek来帮忙

正则式编程中比较难的一部分,身为20年程序员的我,也都忘光了规则。不怕,有deepseek呢。

提示词如下

请用Python代码。将字符串里面的视频asr文本内容获取到。具体的文本如下,:“标题: coze实现AI智能体开发零门槛 #ai #ai智能体 #coze #智能体 作者: 滔滔讲AI 视频ASR文本: ai 的终点是智能体 ai 应用已经很火了有的人还不会用更有的人还不知道是干啥的下午两点直播间开始讲 ai 智能体 ai 应用 视频或图片OCR文本: AI智能体 coze平台”。请写成通用规则,因为在后续我还不会有多个这样的文本需要处理。

得到结果 

# 在这里,您可以通过 ‘args’  获取节点中的输入变量,并通过 'ret' 输出结果
# 'args' 和 'ret' 已经被正确地注入到环境中
# 下面是一个示例,首先获取节点的全部输入参数params,其次获取其中参数名为‘input’的值:
# params = args.params; 
# input = params.input;
# 下面是一个示例,输出一个包含多种数据类型的 'ret' 对象:
# ret: Output =  { "name": ‘小明’, "hobbies": [“看书”, “旅游”] };
import re
async def main(args: Args) -> Output:
    params = args.params

    asr_content = extract_video_asr(params['input'])


    # 构建输出对象
    ret: Output = {
        "asr_content": asr_content
        #"key0": params['input'] + params['input'], # 拼接两次入参 input 的值
        #"key1": ["hello", "world"],  # 输出一个数组
        #"key2": { # 输出一个Object 
        #    "key21": "hi"
        #},
    }
    return ret



def extract_video_asr(text: str) -> str:
    """
    从包含结构化字段的文本中提取视频ASR文本内容
    
    :param text: 包含多个字段的原始文本字符串
    :return: 提取到的ASR文本内容(若无则返回空字符串)
    """
    pattern = r"\*\*视频ASR文本:\*\*(.*?)(?=\s*\*\*|$)"
    match = re.search(pattern, text, re.DOTALL)
    return match.group(1).strip() if match else ""

# 示例用法
#sample_text = """"**标题:** 豆包搜索 AI搜索...(你的示例文本)"""


#print(asr_content)    

五、搞定

========扣子系列文章==============================

扣子:开启AI创新的无限可能,扣子免费教程(1)-CSDN博客

扣子 依托大模型技术,AI 应用成就独立解决方案,扣子免费教程(2)_扣子 智能应用-CSDN博客

一文搞懂扣子的空间、资源、权限和架构,扣子免费教程(3)

什么是智能体,扣子智能体功能概述,一文搞懂智能体,扣子免费系列教程(4)-CSDN博客

不到一分钟,创建第一个AI恋人智能体,永远在线不会惹你生气。扣子免费系列教程(5)

掌握与 AI 对话技巧!提示词编写与优化全攻略,扣子免费系列教程(6)-CSDN博客

智能体的多种创建方式,扣子免费系列教程(7)

扣子平台哪些功能实现不了,都有哪些坑,我先帮你踩了,扣子智能体免费系列教程(8)

搭建小红书梗图、歪理生成器工作流,批量生成图片,创作速度飞起,奶奶都能看明白的扣子智能体免费系列教程(9)

创建用户交互界面并调用工作流,可定制的工作流,奶奶都能看明白的扣子智能体免费系列教程(10)

智能体的核心技能之插件,插件详解和实例 ,扣子免费系列教程(11)

扣子平台各模块概览,一文掌握基础版和专业版的差别,扣子免费系列教程(12)

一文搞定高质量提示词,扣子免费系列教程(13)

让声音也能“智能”起来。扣子免费系列教程(14)

扣子平台卡片的创建,详解,使用全流程指南(保姆级教程)扣子免费系列教程(15)

利用扣子平台自动生成公众号草稿内容, 扣子免费系列教程(16)

扣子平台的选择器节点的使用,扣子免费系列教程(17)

批量将文案转为小红书风格,循环节点如何使用,如何使用扣子对接飞书多维表格?扣子免费系列教程(18)

搭建自媒体歪理、梗图自定义工作流,deepseek生成爆款歪理梗图,扣子免费系列教程(19)

厉害啦!扣子 (coze) 抓取插件能读抖音文案,用 deepseek 整理,链接读取等功能超棒,不容错过!扣子免费系列教程(20)

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐