下载
登录/ 注册
主页
论坛
视频
热股
可转债
下载
下载

正确地做事--2025第一季

24-12-28 12:43 9466次浏览
谋城
+关注
博主要求身份验证
登录用户ID:
做正确的事
比正确地做事更重要

现在方向确定
就是在绩优股或ETF上做网格

后面侧重点转向正确地做事
从盘前挂单到交易模拟自动化
目前还是不断地完善

后续等资金上300万规模开通量化
可以使用SDK的API接口
自动化交易就可以更进一步

新的一年
新的希望
也要做出新的努力

与诸君共勉
打开淘股吧APP
7
评论(902)
收藏
展开
热门 最新
谋城

25-01-24 01:49

0
01:23 1月24日电,OpenAI创始人Sam Altman表示,ChatGPT的免费版将会推出O3-mini。
谋城

25-01-23 23:59

0
你的思路非常清晰且实用!通过将帖子合并、格式化处理、筛选和生成问答对,可以显著提高数据的质量和训练效果。以下是对你思路的详细分析和优化建议:

---

## 1. **整体思路的可行性**
  - **合并帖子**:将主帖和回帖按时间线合并,形成更完整的文本文件,有助于保持内容的连贯性和上下文关系。
  - **格式化处理**:通过 AI 工具(如豆包或 DeepSeek)自动添加标点符号、去除空格、润色文字,可以大幅提升数据的可读性和质量。
  - **筛选内容**:删除或屏蔽与训练目标无关的内容(如证券交易的具体操作),可以避免噪声数据干扰模型训练。
  - **生成问答对**:通过 AI 工具生成问答对,并人工审核,可以确保问答对的准确性和相关性。

---

## 2. **优化建议**
  - **分阶段处理**:
  1. **合并与格式化**:
  - 将主帖和回帖按时间线合并,形成 30 个左右的综合文件。
  - 使用 AI 工具对文本进行格式化处理(如添加标点符号、去除空格、润色文字)。
  2. **筛选与分类**:
  - 删除或屏蔽与训练目标无关的内容(如证券交易的具体操作)。
  - 按主题(如经济、文化、交易等)对帖子进行分类,方便后续训练。
  3. **生成问答对**:
  - 使用 AI 工具生成问答对,并人工审核和修正。
  - 将问答对存储到数据库或文件中,方便后续调用和训练。
  - **工具选择**:
  - **格式化处理**:可以使用豆包、DeepSeek 或 OpenAI 的 GPT-4 进行文本润色和格式化。
  - **生成问答对**:可以使用 DeepSeek-R1 或 GPT-4 生成问答对。
  - **数据存储**:将处理后的数据存储到数据库(如 SQLite 或 MySQL)中,方便管理和调用。

---

## 3. **具体实现步骤**
  - **合并帖子**:
  - 将主帖和回帖按时间线合并,形成综合文件。
  - 示例代码:
  ```python
  def merge_posts(main_post, replies):
  return main_post + "\n" + "\n".join(replies)

  # 示例
  main_post = "这是主帖内容。"
  replies = ["这是回帖1。", "这是回帖2。"]
  merged_content = merge_posts(main_post, replies)
  print(merged_content)
  ```

  - **格式化处理**:
  - 使用 AI 工具对文本进行格式化处理。
  - 示例代码(使用 DeepSeek-R1):
  ```python
  from openai import OpenAI

  client = OpenAI(api_key="", base_url="https://api.deepseek.com")

  def format_text(text):
  prompt = f"请对以下文本进行格式化处理(添加标点符号、去除空格、润色文字):\n{text}"
  response = client.chat.completions.create(
  model="deepseek-reasoner",
  messages=[{"role": "user", "content": prompt}],
  max_tokens=1000
  )
  return response.choices[0].message.content

  # 示例
  raw_text = "这是未格式化的文本 有很多空格 和 错别字"
  formatted_text = format_text(raw_text)
  print(formatted_text)
  ```

  - **生成问答对**:
  - 使用 AI 工具生成问答对。
  - 示例代码:
  ```python
  def generate_qa_pair(text):
  prompt = f"请根据以下内容生成一个问题和答案:\n{text}"
  response = client.chat.completions.create(
  model="deepseek-reasoner",
  messages=[{"role": "user", "content": prompt}],
  max_tokens=200
  )
  return response.choices[0].message.content

  # 示例
  post_content = "我认为技术分析在交易中非常重要。"
  qa_pair = generate_qa_pair(post_content)
  print(qa_pair)
  ```

---

## 4. **注意事项**
  - **数据隐私**:确保不传输敏感信息,尤其是在使用第三方 AI 工具时。
  - **数据质量**:在生成问答对后,建议人工审核和修正,确保问答对的准确性和相关性。
  - **成本控制**:频繁调用 API 可能会增加成本,建议批量处理数据,减少调用次数。

---

## 5. **总结**
你的思路非常合理且高效!通过合并帖子、格式化处理、筛选内容和生成问答对,可以显著提高数据的质量和训练效果。如果你需要进一步的帮助(如代码实现或工具选择),请随时告诉我!😊
谋城

25-01-23 23:37

0
你提到每天发 5 个帖子,12 年大约有 7,800 条帖子。如果每条帖子平均有 200 字,那么总数据量约为 **156 万字**。 

-- 其实
每天 5 个帖子,每个帖子平均 200 字(我觉得,即使去掉转贴的内容,这两个数字都有点保守)
那么每天就是 1000 字
一年 36.5 万
12.5 年就是 450 万字

比刚才算的高的多。
谋城

25-01-23 23:29

0
你的问题非常关键!从你的描述来看,你的帖子内容时间跨度大、数量多(约七八千条),且质量高(忠实还原了你的思考),这些数据非常适合用于训练一个个性化的 GPT 模型。以下是对你问题的详细分析和建议:

---

## 1. **数据量是否足够?**
  - **数据量评估**:
  - 你提到每天发 5 个帖子,12 年大约有 7,800 条帖子。如果每条帖子平均有 200 字,那么总数据量约为 **156 万字**。
  - 对于训练一个个性化的 GPT 模型来说,这个数据量是足够的。通常,微调 GPT 模型需要至少数十万字的文本数据,而你的数据量已经远超这个门槛。
  - **数据质量评估**:
  - 你的帖子内容忠实还原了你的思考,且涵盖了广泛的主题(社会、经济、文化、教育、交易等),这使得数据具有很高的多样性和深度。
  - 高质量的数据可以显著提升模型的个性化表现,使其更好地理解你的思维模式和表达风格。

---

## 2. **手动整理数据的可行性**
  - **优点**:
  - **高还原度**:手动整理可以确保数据的准确性和一致性,避免自动化工具可能引入的噪声。
  - **灵活性**:你可以根据需要对数据进行筛选、分类和标注,例如按主题(经济、文化、交易等)或时间(2013-2015 年)进行整理。
  - **挑战**:
  - **时间成本**:手动整理 7,800 条帖子可能需要较长时间,尤其是如果你需要将每条帖子转化为问答对。
  - **人力成本**:如果数据量较大,可能需要多人协作或分阶段完成。

---

## 3. **如何高效整理数据?**
  - **分阶段整理**:
  1. **初步筛选**:先筛选出最具代表性或最重要的帖子(例如按主题或时间)。
  2. **转化为问答对**:将筛选后的帖子转化为问答对。可以借助工具(如 OpenAI 的 GPT-4 或 DeepSeek-R1)辅助生成问答对。
  3. **逐步扩展**:在初步整理完成后,逐步扩展到更多数据。
  - **工具辅助**:
  - 使用 AI 工具(如 GPT-4 或 DeepSeek-R1)自动生成问答对,然后手动校对和修正。
  - 示例代码:
  ```python
  from openai import OpenAI

  client = OpenAI(api_key="", base_url="https://api.deepseek.com")

  def generate_qa_pair(text):
  prompt = f"请根据以下内容生成一个问题和答案:\n{text}"
  response = client.chat.completions.create(
  model="deepseek-reasoner",
  messages=[{"role": "user", "content": prompt}],
  max_tokens=100
  )
  return response.choices[0].message.content

  # 示例
  post_content = "我认为技术分析在交易中非常重要。"
  qa_pair = generate_qa_pair(post_content)
  print(qa_pair)
  ```
  - **数据存储**:
  - 将整理后的问答对存储到数据库(如 SQLite 或 MySQL)中,方便后续调用和训练。
  - 示例表结构:
  ```sql
  CREATE TABLE qa_pairs (
  id INT AUTO_ INCR E MENT  PR IMAR Y KEY,
  question TEXT NOT NULL,
  answer TEXT NOT NULL,
  topic VAR CHAR (50),  -- 主题(如经济、文化、交易等)
  year INT  -- 年份(如 2013)
  );
  ```

---

## 4. **训练模型的建议**
  - **分阶段训练**:
  1. **初步训练**:使用部分数据(如 1,000 条问答对)进行初步训练,测试模型效果。
  2. **增量训练**:根据测试结果逐步增加数据量,优化模型表现。
  - **评估模型效果**:
  - 通过与模型对话,评估其是否准确还原了你的思维模式和表达风格。
  - 根据评估结果调整训练数据或模型参数。

---

## 5. **总结**
  - **数据量足够**:你的 7,800 条帖子(约 156 万字)足以训练一个高质量的个性化 GPT 模型。
  - **手动整理可行**:虽然手动整理需要一定时间,但可以确保数据的高还原度和高质量。
  - **工具辅助提高效率**:可以使用 AI 工具(如 GPT-4 或 DeepSeek-R1)辅助生成问答对,减少手动工作量。

追随高手

25-01-23 23:02

0
这几次都高开不多
谋城

25-01-23 21:57

0
破个屁

直接提前挂卖单啊。
不需要你临盘决策。

我都在这个帖子里说一万遍了
谋城

25-01-23 21:56

0
稍等会儿我就准备回去了。刚才在某宝上浏览,发现不少掘金量化的教程,看起来质量还挺不错。其实之前我也接触过掘金量化相关内容,在我看来,把它的整体结构弄清楚就足够了。对我而言,使用它的那些API并没有太大实际帮助,毕竟我不需要去考虑各种因子和复杂策略,我只需要实现自己的策略就行。

网上有现成的股票或者期货网格策略,花几十块钱就能买到,基本上拿过来就能直接用。不过,我目前还没有开通量化交易,所以这些策略只能拿来研究,暂时没办法实际运用。话说回来,我看银河证券那边的网格交易功能已经相当不错了。从理论上来说,只要做好资金分配,设置好入场价格,同时关注一下除权除息日等关键节点,剩下的就是把各项参数设置妥当,然后每天适当检查。这样看来,直接开通实盘进行量化交易,反倒更稳妥一些。

所以,即便我期待未来AI代理人功能能够尽早实现,这与我现在手动进行资金分配以及设置银河证券的网格单并不冲突,现阶段我完全可以这么操作。今天我还留意到,ChatGPT在苹果笔记本电脑上的版本,似乎能够直接监控电脑上的一些应用软件,我看到它好像可以识别出打开的PyCharm IDE,不过我还没详细测试,等回去之后一定要好好试试,看看这里面到底藏着什么“神奇功能” 。
疏影横斜水清浅

25-01-23 21:46

0
每次收盘后发利好都是坑爹,每次都告诉自己开盘就卖,可是一次都不敢卖,怎么破
谋城

25-01-23 21:13

0
和豆包交流实在是提不起兴趣,问它些数学题,拍照让它解答,倒没什么问题。可一旦涉及需要逻辑推理的任务,它基本就应付不来了。在这方面,deep seek明显强出好几个档次。我琢磨着,接下来得把以前的帖子内容整理一下,这样一来,能把我之前的想法完整梳理一遍,更关键的是,可以把这些内容提供给相关模型,让它学我的个人行为模式。下次有机会,我就打算从这个方向入手,让dvc帮我选股,从日K线走势、分时图走势,还有基本面的市盈率、股息率等不同维度,帮我列出备选股票,至少能帮我先初步筛选一轮,省得我自己头脑一热就做决定。

要是GPT下一步能实现AI代理,也就是AIA景,以后我完全不用开通量化交易,直接让它在手机或者电脑上帮我操作,哪怕是敲键盘下单都行,要是它有桌面完全控制功能,就能直接帮我做出交易下单的决策,这肯定没问题。另外,要是过几个月苹果能把AI引入iOS系统,用起来也会方便很多。不像现在,找个功能都得手动一个个翻找,太麻烦了。

有时候我问deep sea问题,它给出的答案,可能是基于很久以前的搜索结果。设置里的按钮、选项和它说的都大不一样了。所以它给出解决方案,我照着操作,总会发现这儿不对那儿不对。但要是苹果有自家AI,这AI对自家系统肯定了如指掌。我只要说我要连某个WiFi,它就能自动完成操作,不用我再一项项手动选择、操作,省事儿多了。

一方面,手机集成AI功能后,能节省我们大量时间。另一方面,我们能直接和AI交流,让它更了解我,碰上需要做决策的事儿,它还能帮忙辅助,就像一个贴心的辅助系统。这样一来,我们就能空出大量时间,去做一些深层次的思考,对我来说,以后手机应用肯定会越来越强大。

其实我特别希望AI能飞速发展,这样我就不用在学校里拼命内卷了,可以顺着自己的天性发展,不用被迫去做那些不感兴趣又不擅长的事儿,真没必要。就说化学知识,像三价铁离子和铁反应生成二价铁离子,还有氢氧化钠通入少量二氧化碳生成碳酸钠,再通入过量二氧化碳生成碳酸氢钠这类知识,理解背后化学思维,也就是水中氢离子多少影响反应结果这个原理,比强行记住方程式重要多了。

这就回到AI发展的问题上,如果AI足够发达,能不能实现个性化教学呢?它能不能直接告诉我底层逻辑思维,而不是列举一堆现象和方程式让我死记硬背?我觉得死记硬背意义不大,除非是打算深入研究化学专业。对大部分人来说,掌握化学思维模式才是根本,就像股票交易要顺势而为,掌握了思维,学起来轻松,效果也好。但现在大家似乎不太重视这点,一天到晚刷题,真的容易把人弄懵。

从这个角度讲,我期待AI能带来惊艳的表现,这样孩子以后的路也能轻松些。当然,这是和现在拼命刷题的情况对比来说。要是按我的要求,AI得具备各个学科的思维方式,这要求可相当高。它还得有自己的思想和思维模式,准确来说,是跨学科思维模式,并且在此基础上形成更高级、更高维度的认知。这需要潜移默化的积累,不断学,更重要的是要不断阅读和思考,就像我们学如何学一样,也要学会思考自己是怎么思考的。这理念有点像国外大学宽进严出,入门要求不高,但想深入钻研,做好做精,要求可不低。
谋城

25-01-23 21:03

0
目前,论坛审核速度明显比以前慢了许多,主要原因在于用户数量大幅增加,仅依靠人工审核,效率实在是非常低。虽说在早期,人工审核发帖曾是陶县的一大特色,但如今显然已经跟不上时代发展的步伐了。这还是在股票市场不算特别火爆的情况下,要是股票行情更加火爆,市场热度更高一些,这个问题恐怕会愈发严重。当然,这或许只是我杞人忧天罢了,毕竟不在其位,不谋其政,我还是把自己的事情做好就行。

今天我看到一个视频提到,1月30号OpenAI又要有大动作了。作为普通人,我一直有一种强烈的紧迫感,感觉这一切很魔幻。看着AI领域的最新进展,一方面,会为AI的飞速发展感到安心,它未来或许能解决人类的疾病问题,甚至实现全面基本收入,让人不用担心温饱与住房;但另一方面,又会担心自己一无所有,未来沦为底层弱者。要是现在都没有好的赚钱机会,等AI全面进入劳动力市场,自己就更没有竞争力了,这种情况下,基本就很难有翻身的机会了。

从这个角度来看,我觉得做交易可能比一般行业还是略胜一筹,不过优势也并不明显。如果AI继续以如此恐怖的速度发展,即便未来股票市场繁荣起来,能不能从中赚到钱也很难说。就像我前几天和ChatGPT讨论的,可能只能拉长投资时间周期,像现在这种超短线互相博弈的玩法,对于绝大多数个人投资者来说肯定会越来越难以为继,毕竟AI在这方面绝对能秒杀一众韭菜,这是毫无疑问的。当然,这也算是在为别人操心,或许我自己也得把操作周期拉得越来越长,或者至少多选择一些适合做网格交易的标的。

在这方面,我一直在论坛持续发帖,希望能遇到志同道合的人,向我推荐一些经过他们分析,无论是基本面还是技术面,尤其是股票分时走势等,适合我参与网格交易的标的。但很可惜,这样有价值的交流非常少,也就一两个月前提到证券etf时,有几位网友和我交流了不同品种的etf。所以从这个意义上讲,如果我能训练出一些GPT,让它帮我从市场中筛选相关股票,甚至帮我挑选etf,效率可能会高很多。

不过目前,要完全从头开始训练难度还比较大。我寄希望于deepseek的Ie模型能在这方面有所突破,毕竟听说它收费很便宜,而且就我使用体验来说,系统反应速度非常快。只是不清楚在模型训练方面它的支持情况如何,等会儿回去我再研究研究它的API接口。只要提出需求,它就能自行调用API生成一段判断代码,完成所需任务,这对它来说轻而易举,而且它也很乐意通过这种方式吸引更多用户,还能适当收费盈利。

如果能在deep sea上训练出一个模型,即便功能不用特别强大,只要能达到类似我的思维方式,并且还能查询相关金融接口获取数据那就更好了。当然,这里存在一个数据来源的问题,不过这也不算大问题,我可以付费从第三方购买数据,只要第三方能提供相关API接口,我就可以把接口文档发给模型,让它生成相关代码。要是模型调试不方便,我可以在本地编写代码并调试通过,这样就能正常使用了。

另外,如果能调用模型的API,还有一个好处,就是可以持续运行相关代码实现盘中监控并发出信号,这就能和现有的网格单完美结合。只不过最终下单还需要手动操作,不过既然是用Python来实现,完全可以把需要下单的内容写入数据库,然后我自己再编写一个程序,从数据库中提取买卖单信息,通过Python模拟点击的方式下单。下单成功后,再把成功信息回写到数据库,这样系统就能识别订单状态。当再次出现类似信号时,系统又能做出判断。这样一来,所有交易策略无需在本地实现,本地只需负责模拟下单以及判断是否成交,相当于两个不同的Python应用程序可以通过数据库、内部消息发送或者HTTP REST请求等方式实现信息交互,从而将整个交易流程整合起来。当然,这也只是我个人初步的一些想法。
刷新 首页 上一页 下一页 末页
提交