V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
genffy
V2EX  ?  程序员

问答系统,使用元数据,还是抓网页数据的问题

  •  
  •   genffy ·
    genffy · 120 天前 · 639 次点击
    这是一个创建于 120 天前的主题,其中的信息可能已经有所发展或是发生改变。

    腾讯云最新优惠活动来了:云产品限时1折,云服务器低至88元/年 ,点击这里立即抢购:9i0i.cn/qcloud,更有2860元代金券免费领取,付款直接抵现金用,点击这里立即领取:9i0i.cn/qcloudquan

    (福利推荐:你还在原价购买阿里云服务器?现在阿里云0.8折限时抢购活动来啦!4核8G企业云服务器仅2998元/3年,立即抢购>>>:9i0i.cn/aliyun

    想在公司内部实验下问答系统,也就是目前市面上常见的 llm + rag 但是在如何处理现有数据有点纠结

    是去爬网页上的数据呢,还是直接导元数据,主要是

    • confluence
    • gitlab
    • jira

    这三种源。

    #rag #llm #问答系统#

    genffy
        1
    genffy  
    OP
       120 天前
    jira ,confluence 我倾向爬页面上关系性强一点,gitlab 有点拿不准,我们 gitlab 只是个代码存储,除了 pr ,没有 cr, issue 这些资产在上面。
    lixile
        2
    lixile  
       120 天前
    mark 一下 问答系统 有对应参考开源框架吗
    genffy
        3
    genffy  
    OP
       120 天前
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1253 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 18:13 · PVG 02:13 · LAX 11:13 · JFK 14:13
    Developed with CodeLauncher
    ? Do have faith in what you're doing.


    http://www.vxiaotou.com