作者: 连小白 (连享会)
邮箱: lianxhcn@163.com

提要:本文介绍了一种适合零基础用户的爬取深交所互动易投资者问答数据的方法。通过结合 AI 助手(如豆包)和浏览器的 F12 开发者工具,用户无需编写复杂代码,只需复制粘贴关键信息,即可快速获取高质量的问答数据。本文详细讲解了操作步骤、常见问题及解决方案,并提供了通用的爬虫程序模板,帮助读者轻松上手,完成数据爬取任务。

  • Title: 零基础爬虫:豆包 × F12,搞定互动易投资者问答
  • Keywords: Python爬虫, 互动易, 投资者问答, 零基础教程, 豆包AI

0. 简介

你有没有遇到过这种情况:看到一家公司的投资者问答,想把几年的数据整理下来分析,却发现网页根本没法复制粘贴,一条一条手动摘录几乎不可能?

多人的第一反应是:网络爬虫!但对于多数初学者而言,爬虫的学习曲线非常陡峭,从环境配置到网页分析、代码编写,再到反爬机制的应对,往往让人望而却步。

其实,爬虫并不一定要从零开始写代码。随着 AI 技术的发展,我们有了更智能、更高效的工具来辅助我们完成爬取任务。本文想告诉你一种更友好的路:借助 AI 助手 (本文使用亲民且免费的 豆包,当然,你也可以使用其他 AI 工具),配合浏览器自带的 F12 工具,不需要懂代码细节,只要会复制粘贴、会和 AI 对话,就能把互动易的问答数据完整拿下来。

无论你是完全零基础的小白,还是想提升效率的科研人员、投资者,这套 "AI + F12" 新范式,都能让你快速拿到高质量的投资者问答数据。

核心区别:传统爬虫 vs AI 协作爬虫

特性 传统爬虫教程 AI 协作爬虫
入门门槛 高:需掌握 Python 基础、网络请求原理 低:会复制粘贴即可
核心能力 写代码、懂逻辑、懂反爬 懂业务、懂操作、懂沟通
代码生成 手动编写,易出错,适配性差 AI 生成,精准匹配真实接口
适用场景 长期学习、专业开发 快速取证、数据分析、课程作业、投资者调研

准备工作:你需要准备什么?

  1. 一台电脑(Windows 或 Mac 均可)
  2. 一个浏览器(推荐 Chrome 或 Edge,F12 功能最稳定)
  3. Python 环境(版本 3.8 及以上,已安装并配置环境变量)
  4. 安装必要依赖(打开 cmd/终端,复制粘贴以下命令回车,无需理解含义):
pip install requests pandas

安装成功后,无报错提示即完成准备工作,可正式开始!

如果你经常使用 VS Code 编辑器,也准备长期使用 Python 进行数据分析,建议安装 Anaconda 套装 + VS Code + Python 插件,能大大提升你的编程体验和效率。详情参见 连玉君-2026-金融数据分析, Chap 2

2. 实现步骤

整个流程就像是你和一个专业爬虫开发者在合作完成任务一样,AI 是你的智能助手,帮你分析、核对、生成代码,而你则提供关键信息、确认细节。主要包括如下步骤:

  • 给 AI 发送"角色设定",开启指导模式
  • 获取目标公司互动易网址
  • F12 抓取真实请求信息(URL/请求方式/参数/请求头/返回数据)
  • 核对信息有效性,整理成结构化提示词
  • 生成 Python 爬虫代码,运行并保存数据
  • 后续数据清洗、分析、可视化(可选)

下面我们将逐步展开每个步骤的具体操作,确保你能跟上节奏,最终成功爬取到互动易的投资者问答数据!

第一步:给豆包发送"角色设定",开启指导模式

AI 默认行为可能是直接甩代码,大概率不符合需求。我们需要先给它"指令",让它变成专属爬虫指导老师。

请将下面这段提示词 完整复制,发送给豆包:

用户提问:
接下来我们要合作完成深交所互动易投资者问答的Python爬虫任务。请你扮演一位爬虫开发引导者,严格遵守以下规则:

  1. 不要直接生成代码,除非我明确说「请生成代码」;
  2. 每次回复只问我1-2个最关键的问题,等我回答后再继续,不一次性问完;
  3. 引导我依次提供:目标公司互动易网址、F12抓到的真实请求信息(URL/请求方式/参数/请求头/返回数据),不自行假设任何信息;
  4. 我提供信息后,先帮我核对信息有效性,有问题及时指出,信息足够后先整理成结构化提示词让我确认,确认后再生成代码;
  5. 代码要求:零基础能跑、带中文注释、自动创建文件夹、保存为CSV格式、适配互动易反爬规则。
    收到后请回复「明白,请告诉我你要爬取的互动易公司网址」。

AI 回复:
明白,请告诉我你要爬取的互动易公司网址。

第二步:获取目标公司互动易网址

以 比亚迪(002594) 为例,按以下步骤操作:

  1. 打开浏览器,访问 深交所互动易官网
  2. 在顶部搜索框输入"比亚迪"或股票代码"002594",点击搜索结果进入公司主页;
  3. 点击导航栏"互动问答",进入问答详情页;
  4. 复制浏览器地址栏中的 完整网址(含 stockcode 和 orgId 参数)。

用户提问:
我要爬取的网址是:https://irm.cninfo.com.cn/ircs/company/companyDetail?stockcode=002594&orgId=gshk0001211

AI 回复:
好的。接下来需要你用 F12 抓到该页面问答数据的真实请求信息。现在请打开该网址,按 F12 键打开开发者工具,告诉我是否打开成功?

Note: 此时你停留在如下页面

20260409214423

第三步:F12 开发者工具入门(核心技能)

F12 是浏览器内置的免费工具,能让你看到网页"背后的秘密"——互动易的问答数据并非直接嵌入页面,而是通过隐藏接口加载,这一步就是找到这个接口。

什么是 F12?

F12 是开发者工具(Developer Tools)的快捷键,打开后会在浏览器右侧/底部弹出面板,核心功能包括:

  • Network(网络):查看页面加载的所有网络请求(重点!找数据接口);
  • Elements(元素):查看网页 HTML 结构;
  • Console(控制台):调试代码、查看报错;
  • Application(应用):查看 Cookie、缓存等数据。

20260409214731

{width="90%"}

F12 扩展学习链接(可选)

第四步:用 F12 抓真实接口(关键一步)

这是爬虫成功的核心:找到承载问答数据的"真实接口",而非浏览器显示的页面网址。

Step 1:打开 Network 标签并刷新页面

  1. 确保目标公司问答页面已打开(如比亚迪问答页);
  2. 按下 F12 键(Mac 按 Command+Option+I),打开开发者工具;
  3. 点击顶部 Network 标签,再点击面板中的 刷新按钮(或按 F5),让工具记录所有请求。

用户提问:
已打开 Network 标签并刷新页面,面板出现了很多请求条目。

Step 2:筛选目标请求

Network 面板请求繁多,需快速定位含问答数据的请求:

  1. 在面板顶部 Filter(筛选框) 中输入 question(小写,无需引号);
  2. 面板会自动筛选出含"question"关键词的请求(互动易问答接口均含该关键词);
  3. 点击任意一条状态码为 200 的请求(状态码 200 表示请求成功)。

用户提问:
输入 question 筛选成功,点击请求后能看到 Headers 和 Response 标签。

Step 3:复制 4 类关键信息(原封不动,勿修改)

点击筛选后的请求,右侧会显示子面板,依次复制以下信息:

  • 信息 1:请求 URL。在子面板 Headers 标签中,找到 Request URL,鼠标选中整行 URL,右键 → 复制(勿手动选中,避免漏字符)。

  • 信息 2:请求方式(GET/POST)。在 Request URL 上方,找到 Request Method,记录显示的 GET 或 POST(互动易多为 POST),直接告知 AI。

  • 信息 3:请求头(Cookie + User-Agent)

    • 在 Headers 标签中,向下滚动找到 Request Headers 区域;
    • 找到 User-Agent 行:复制 : 后的所有内容(从 Mozilla 开始到末尾);
    • 找到 Cookie 行:复制 : 后的所有内容(整行较长,完整复制);
    • 将两类信息一起发给 AI,标注清晰。
  • 信息 4:返回数据(Response)

    • 点击子面板 Response 标签;
    • 内容为 JSON 格式(含 pageNo/rows/mainContent 等关键词);
    • 按 Ctrl+A(Mac 按 Command+A)全选,Ctrl+C 复制,直接发给 AI。

用户提问:

  • 请求 URL:https://irm.cninfo.com.cn/newircs/company/question
  • 请求方式:POST
  • User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/146.0.0.0 Safari/537.36
  • Cookie:(请替换为你自己从 F12 复制的真实 Cookie,每次会话不同)
  • 返回数据:{"pageNo":1,"pageSize":10,"total":357,"totalPage":36,"rows":[{"indexId":"...","contentType":1,"trade":["制造业"],"mainContent":"请公司按时披露重要信息",...}]}

第五步:AI 核对信息,生成代码

你提供所有信息后,AI 会先核对有效性(如 URL 是否完整、Cookie 是否缺失):

  • 若信息有问题,AI 会指导你重新复制;
  • 若信息无误,AI 会整理成结构化提示词让你确认。
Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐