biyelunwen/slides/20251213/pages/审稿意见与解决方案.md

137 lines
4.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
layout: section
color: emerald
---
<div class="w-7/10 mx-auto text-center">
## 审稿意见与解决方案
<hr/>
仅列出涉及到流程或数据方面的审稿意见及解决方案
</div>
---
layout: top-title
color: emerald
title: 方法学描述不清与创新性未突出
---
::title::
# 方法学描述不清与创新性未突出
::content::
- **核心问题**所提出的新方法基于MCMC拟合单峰/双峰分布推断次级分歧时间)缺乏清晰、系统的阐述。
- **具体建议**
- 明确说明新方法相较于现有方法(如 D3 test, PhyloNet 等)的**主要优势**例如是否能同时识别introgressed基因并估计introgression发生时间
- 在**摘要、引言、方法、讨论**各部分突出方法的创新点而非仅模糊称为“MCMC拟合模型”。
- 澄清关键术语与参数含义(如 Line 320/356 中的 “r” 是什么速率Line 353 的“偏差”指什么?)。
- 解释“组合比例”combination ratio和“分类因子”classification factor如何计算或估计。
- 说明用于判断单峰 vs. 双峰分布优劣的**统计检验方法**(如 AIC、BIC、Bayes因子等
- **解决方案:**
- 论文文字修改:模型描述改进
- ==开发分布优劣的统计检验方法==
---
layout: top-title
color: emerald
title: 方法验证不足
---
::title::
# 方法验证不足
::content::
- **核心问题**仅在一个小型植物类群Hippophae10个种中应用缺乏普适性验证。
- **具体建议**
- 增加**模拟数据实验**验证方法在不同introgression强度、重复事件、ILS水平下的表现。
- 或至少在**其他真实数据集**(不同类群)中测试方法,证明其可推广性。
- 讨论方法的**适用范围与局限性**如是否适用于大规模物种能否处理多次introgression
- **解决方案:**
- ==bpp模拟数据实验==
- ==添加其他真实数据集模拟(蛇)==
---
layout: top-title
color: emerald
title: 系统发育与分化时间推断存在潜在偏差
---
::title::
# 系统发育与分化时间推断存在潜在偏差
::content::
- **核心问题**:分化时间估计可能受取样策略和模型选择影响。
- **具体建议**
- 检查是否所有基因树具有**一致的分类单元取样**;若不一致,需说明如何校正由此带来的年龄估计偏差。
- 质疑使用**Yule过程**作为先验(尤其当包含种内样本与远缘类群时),建议考虑更合适的物种形成模型。
- 说明**核苷酸替代模型如HKY的选择依据**是否进行过模型选择如jModelTest, ModelFinder等
- 澄清图1与图4中**分化时间估计差异的原因**评估其对introgression时间推断的影响。
- **解决方案:**
- ==使用MCMCTree替代beast做分化时间计算可以直接使用更好的替代模型==
- ==使用少量基因验证yule过程作为物种形成模型的合理性==
- 论文文字修改:增加对基因树取样一致性和物种形成模型选择的讨论
---
layout: top-title
color: emerald
title: 数据处理与结果解释需加强严谨性
---
::title::
# 数据处理与结果解释需加强严谨性
::content::
- **核心问题**从3149个单拷贝基因中仅保留177个“可靠”基因可能导致结果偏倚。
- **具体建议**
- 明确“可靠基因”的筛选标准高bootstrap支持 ≠ 正确建议改称“informative genes”。
- 强调所识别的64个introgressed基因**不代表全基因组水平的introgression比例**,因多拷贝或功能重要基因可能被过滤掉。
- 对这64个基因进行**功能注释分析**,探讨其生物学意义。
- 排除**污染**作为introgression信号来源的可能性如通过检查reads mapping、组织来源等
- **解决方案:**
- ==探索模型是否可能涵盖低支持度的基因并在后续评估informative genes结果是否与之相近能否替代==
---
layout: top-title
color: emerald
title: 材料与可重复性问题
---
::title::
# 材料与可重复性问题
::content::
- **核心问题**:缺乏关键实验细节和代码共享。
- **具体建议**
- 提供**新方法的完整代码**如GitHub链接确保他人可复现。
- 补充**凭证标本信息**(采集号、保存的标本馆)。
- 将原始测序数据raw reads提交至**SRA**而非作为补充材料补充材料应包含组装后的转录本、CDS、蛋白序列等并拆分为小于1GB的压缩包。
- **解决方案:**
- ==从头分析,备份完整代码与中间文件==
- ==使用rstan重新实现MCMC模型方便提交代码==