AI实验室 | Molly

2026-04-08 阅读 6 分钟

使用LLM自动化数据新闻写作流程

AI应用数据新闻 LLM

数据新闻的生产流程通常包括：数据采集、数据清洗、可视化制作、文字写作等多个环节。其中，文字写作往往是耗时最长但标准化程度最高的部分。本文探讨如何结合大语言模型与自动化工具，提升数据新闻的生产效率，同时保持人文关怀。

传统流程的痛点

在传统数据新闻编辑室，一篇完整的数据报道需要记者完成从数据到故事的全部工作。这不仅对记者的综合能力提出高要求，也导致内容产能受限。尤其在突发事件报道中，记者往往没有足够时间深入挖掘数据背后的故事。

LLM辅助写作方案

我的解决方案是将LLM作为写作助手，嵌入到数据新闻的标准流程中：

import openai
import pandas as pd
from datetime import datetime

class DataNewsWriter:
    def __init__(self, api_key):
        self.client = openai.OpenAI(api_key=api_key)
    
    def generate_article(self, data, template):
        prompt = f"""
        基于以下数据生成一篇数据新闻报道：
        
        数据摘要：{data.summary}
        关键发现：{data.key_findings}
        数据来源：{data.source}
        
        要求：
        1. 采用倒金字塔结构
        2. 包含至少3个具体案例
        3. 结尾有人文反思段落
        """
        
        response = self.client.chat.completions.create(
            model="gpt-4",
            messages=[{"role": "user", "content": prompt}]
        )
        return response.choices[0].message.content

通过结构化的prompt设计，LLM能够按照新闻写作规范生成初稿，而记者的职责转变为核实事实、补充案例、润色语言。这种人机协作模式让记者有更多时间专注于深度报道。

人文关怀的保持

使用AI辅助写作时，我始终坚持一个原则：AI生成的是框架，而温度必须由人来赋予。每一篇最终发布的数据新闻，都会在结尾加入"人文反思"段落，这些内容是AI无法替代的。

💭 我的反思

技术可以提升效率，但无法替代对真实世界的感知。AI可以告诉我们"数据说了什么"，但只有人才能追问"数据为什么重要"。在追求效率的同时，我们不应忘记新闻的本质——讲述人的故事。

M

Molly 数据叙事者

2026-04-05 阅读 8 分钟

从零构建一个AI播客助手

Python AI工具

播客制作涉及选题策划、内容撰写、录音、剪辑、发布等多个环节。对于个人创作者来说，全流程独立完成并不容易。本文记录我如何使用Whisper、GPT-4和ElevenLabs打造一个半自动化的播客制作流水线。

工具选型

经过对比测试，我选择了以下技术栈：

Whisper：OpenAI的语音识别模型，用于录音转文字
GPT-4：用于生成对话脚本和节目笔记
ElevenLabs：AI配音，支持多种声音风格

实现要点

核心代码结构如下：

import whisper
from elevenlabs import generate, play
import openai

# 录音转文字
def transcribe_audio(audio_path):
    model = whisper.load_model("base")
    result = model.transcribe(audio_path)
    return result["text"]

# 生成对话脚本
def generate_script(topic):
    response = openai.ChatCompletion.create(
        model="gpt-4",
        messages=[
            {"role": "system", "content": "你是一个播客主持人，风格幽默有趣"},
            {"role": "user", "content": f"为主题'{topic}'生成一期播客的对话脚本"}
        ]
    )
    return response.choices[0].message.content

# AI配音
def text_to_speech(text, voice="Rachel"):
    audio = generate(text=text, voice=voice)
    return audio

💭 我的反思

AI配音虽然已经非常逼真，但我认为它更适合"辅助"而非"替代"。真正的播客魅力在于真实的人声和情感表达。让AI处理重复性工作，而把创意和情感留给人类创作者，这才是最佳平衡。

M

Molly 数据叙事者

2026-04-01 阅读 5 分钟

提示词工程实践：让AI更懂你的叙事意图

提示词工程方法论

同样的AI工具，为什么有人用起来效果惊艳，有人却总觉得"AI在胡说八道"？答案往往在于提示词的设计。本文分享我在内容创作中积累的提示词技巧。

结构化提示词模板

一个好的提示词应该包含以下要素：

角色定义：明确AI扮演的角色身份
任务描述：清晰说明需要完成的任务
约束条件：规定输出格式、长度、风格等
示例参考：提供少量示例帮助AI理解

# 优质提示词示例
prompt = """
## 角色
你是一位资深数据新闻记者，擅长用通俗语言解释复杂数据。

## 任务
为以下数据主题撰写一篇800字的新闻报道：
主题：{topic}
数据来源：{source}

## 要求
1. 标题吸引人且准确
2. 导语包含最重要的数据发现
3. 正文用2-3个具体案例解读数据
4. 结尾200字的人文反思

## 参考风格
参考《三联生活周刊》的数据报道风格
"""

💭 我的反思

提示词工程本质上是"学会提问"的能力。在AI时代，问题比答案更值钱。一个好的问题能够激发AI的潜力，而一个模糊的问题只会得到泛泛的答案。学会精确地表达需求，是每个人都需要掌握的技能。

M

Molly 数据叙事者

2026-03-25 阅读 7 分钟

用Python实现小红书笔记自动排版

Python 自动化

对于内容创作者来说，重复性的排版工作往往占据大量时间。本文介绍如何用Python自动化小红书笔记的排版流程，让你把更多精力放在内容本身。

核心思路

小红书笔记的核心要素包括：标题、封面图、正文内容、话题标签。我们可以创建一个模板系统，自动填充这些要素。

from dataclasses import dataclass
from typing import List

@dataclass
class小红书笔记:
    标题: str
    封面文字: str
    正文: str
    话题: List[str]
    
    def格式化(self) -> str:
        # 话题转为标签格式
        话题标签 = " ".join([f"#{话题}#" for 话题 in self.话题])
        
        return f"""
{self.封面文字}

{'-'*20}

{self.正文}

{'-'*20}

{话题标签}
"""

💭 我的反思

自动化工具是提升效率的好帮手，但过度依赖工具也可能让人变得机械化。排版可以自动化，但内容的创意和温度必须来自真实的思考。工具服务于人，而非相反。

M

Molly 数据叙事者