分子バーコードとウェブ

ニュース

ホームページホームページ / ニュース / 分子バーコードとウェブ

Nov 10, 2023

分子バーコードとウェブ

Edizione di biologia della comunicazione

Communications Biology volume 5、記事番号: 1411 (2022) この記事を引用

1834 アクセス

1 引用

18 オルトメトリック

メトリクスの詳細

従来、患者の渡航歴は輸入マラリア症例と自国マラリア症例を区別するために使用されてきたが、三日熱マラリア原虫の肝臓の休眠期がこのアプローチを混乱させる。 分子ツールは、輸入された症例を特定し、マッピングするための代替方法を提供します。 21 か国の 799 個の三日熱マラリア原虫ゲノムに適用された階層的固定インデックスと決定木分析を組み込んだ機械学習アプローチを使用して、高い予測能力を持つ 33-SNP、50-SNP、および 55-SNP バーコード (GEO33、GEO50、および GEO55) を特定しました。感染源の国。 既存の一般的に適用されている 38-SNP バーコード (BR38) のマシューズ相関係数 (MCC) は、62% の国で 0.80 を超えました。 GEO パネルは BR38 を上回り、GEO33 では 90% の国で MCC 中央値が 0.80 以上、GEO50 および GEO55 では 95% でした。 データ分析をサポートするために、オンラインでオープンアクセスの尤度ベースの分類子フレームワークが確立されました (vivaxGEN-geo)。 SNP の選択および分類方法は、マラリア制御プログラムをサポートするために他の使用例に合わせて簡単に修正できます。

過去 3 回の世界マラリア報告書は、マラリア症例の憂慮すべき増加と、サハラ以南アフリカ以外で三日熱マラリア原虫によるマラリアの割合が増加していることを明らかにしており、過去 10 年間にわたる感染伝播を減らすための協調的な取り組みを台無しにしています1。 これらの傾向は、新しい監視ツールの緊急の必要性と、非熱帯熱マラリア原虫種に対するさらなる注意の必要性を浮き彫りにしています。 マラリア制御における特別な課題の 1 つは、人口の流動性が高く、ある国から別の国へのマラリア原虫分離株の輸入(輸入症例)につながり、現地での制御努力を妨げ、アウトブレイクや抗マラリア薬耐性の蔓延のリスクを高める可能性があります。 この課題に対処するには、患者がどこで感染したかを特定するのに役立つツールを開発することが重要です。

三日熱マラリア原虫は、最初の感染から数週間から数か月後に再活性化する肝臓の休眠期(ヒプノゾイト)を形成する能力と、非常に持続性の高い脾臓の炎症を引き起こす能力を考慮すると、局所感染と輸入感染を区別するのは特に困難である。および日常的な診断を回避できる低密度循環血中感染症2、3、4。 三日熱マラリア原虫が、かつてはほぼ排除された複数の地域で再出現していることは、入念な監視の重要性を浮き彫りにしています5,6。 風土病の発生率が低い環境では、一般的に発生率が低下するにつれて輸入症例の相対的な割合が増加しており、特にこれらの地域で輸入された三日熱マラリア原虫症例を特定できる監視ツールの重要性が強調されています5。 従来、輸入症例は患者の渡航歴に関する情報を使用して特定され、マッピングされてきましたが、持続的な脾臓および血液期の感染と晩期再発により、三日熱マラリア原虫に対するこのアプローチの精度は制限されています。 輸入された三日熱マラリア原虫症例を特定し、マッピングするための分子ツールは、従来の疫学ツールを魅力的に補完します。

アンプリコンベースのシークエンシングは、マラリア原虫の標的遺伝子型決定に好まれるアプローチとなっています 7,8。 最新世代のイルミナ シーケンサーなどの並列性の高いシーケンス プラットフォームを使用すると、アンプリコンベースのシーケンスを中程度から高スループットで、高い精度と感度で適用できます。 これらのプラットフォームは柔軟性があり、一塩基多型 (SNP) バーコードの反復強化を可能にし、集団ベースの分子監視に適した手頃な価格のジェノタイピング アプローチを提供できます。

これまでの研究では、ミトコンドリアおよびアピコプラストのマーカーを使用して、地元の三日熱マラリア原虫分離株から輸入されたものを区別していましたが、これらの細胞小器官ゲノムの解像度には制約がありました9、10、11。 2015 年に、一般にブロード バーコードと呼ばれる 42 の SNP のパネルが、寄生虫の指紋採取と地理的割り当てを容易にするために特定されました 12。 42-SNP Broad バーコードは、7 か国の 13 株から入手可能なゲノム データから得られ、標的遺伝子型解析アッセイを使用したいくつかの研究に適用されています 12、13、14。 より最近の研究では、17 か国の 433 株のデータを使用して、別の三日熱マラリア原虫 SNP バーコードが特定されました 15。 このバーコードは、フィンガープリントと地理的割り当ての両方を容易にすることも目的としていましたが、このバーコードの実験的アッセイは利用できず、依然としてインシリコツールのみです15。 さらに、これまでのマラリアの地理的バーコーディング研究はすべて、原産国を評価するために主成分分析などの視覚的手法に依存していました。 このアプローチにはある程度の有用性がありますが、ある程度主観的であり、これらのプロットの作成と解釈に必要な遺伝疫学やバイオインフォマティクスのスキルを持たない可能性がある国家マラリア対策プログラム (NMCP) などのトランスレーショナルエンドユーザーのニーズには応えられません。

私たちの研究の主な目的は、原産国を分類することによって輸入された三日熱マラリア原虫症例を特定および特徴付けるための三日熱マラリア原虫分子マーカーを特定するフレームワークを確立することと、エンドユーザーがデータを分析するためのオンラインでオープンアクセスの情報学プラットフォームを開発することでした。マーカーを使用して生成されます。 私たちの目標は、これらの新しい分子および情報学ツールが、研究者とNMCPの両方がマラリア対策介入をどこにどのように展開するかについての戦略的決定を行うために使用できる証拠の生成をサポートすることです。 当社の分子ツールは主に、Illumina や MinION (Oxford Nanopore Technologies) などのシーケンス プラットフォームを使用した監視フレームワークに合わせて調整されており、数十のマーカーのジェノタイピングを並行して行うことができます。 当社の情報学ツールは、遺伝学や生物情報学のスキルをほとんどまたはまったく持たないユーザーでも、自国または地域の参考研究所で生成されたバーコード ジェノタイピング データを独自に分析および解釈できるように設計されています。 したがって、情報学ツールは、ポリクローナル感染を含む現実世界のマラリアサンプルや、遺伝子型解析の失敗による不完全なデータを含むサンプルに対応できるように設計されています。

遺伝子型の失敗を最小限に抑えるために欠損データ シミュレーションを使用して導出された主要データセット (データセット 1) (補足図 1) は、229,317 個の高品質の有益な SNP と 826 個の高品質サンプルで構成されています。 各サンプルにおけるヘテロ接合性コールの割合の中央値は、0.02% ~ 0.08% の範囲でした。 データセット 1 のサンプルの地理的位置の詳細を補足表 1 に示します。尤度分類器を使用したゲノム全体のデータ分類から導出された国レベルの割り当てを使用すると、27 の分離は提示国とは異なる国分類を提示しました。輸入された可能性のある症例(補足表1)。 これらの症例および単一のサンプルのみで代表される国を除外すると、21 か国から合計 799 の分離株が存在し、データセット 2 を構成しました (補足表 1)。 近隣結合分析により、ほとんどの国の明確な地理的クラスタリングが明らかになりました (補足図 2)。 例外には、アフガニスタン、イラン、インド、スリランカからの分離株が含まれており、これらは単一のクラスターを形成しているように見えました。 国間の違いを解決するには、より大きなサンプルセットを使用してこの地理的地域をさらに分析することが明らかに必要です。 カンボジアと比べてベトナム、ミャンマーと比べてタイなどの国境地域のいくつかの分離株は国間で重複していましたが、これらの国のほとんどの分離株は国境によって区別できました。

SNP パネル選択プロセスを図 1 にまとめます。HFST セレクターを FST 閾値 0.90 (HFST-0.90) で適用すると、地理的割り当てのための 33 個の新しい候補 SNP (ここでは GEO33 と呼びます) のセットが特定されました (補足表 2)。 FST 閾値を 0.95 (HFST-0.95) に増加すると、HFST モデルは 50 個の SNP (本明細書では GEO50 と呼ばれます) を特定しました (補足表 3)。 DT セレクターのみを使用して、55 の SNP (本明細書では GEO55 と呼ばれます) (補足表 4) が特定されました。 補足図3および補足表5に示すように、38-SNP Broadパネル(本明細書ではBR38と呼ぶ)と3つの新しいSNPパネルの間にマーカーの重複はありませんが、3つの新しいSNPパネルの間にはさまざまなレベルのSNP重複が存在します。パネル。 3 つの SNP が 3 つのパネルすべてに存在します。 E141D アミノ酸変化を引き起こす IMC1b 遺伝子 (PVP01_0942600) の PvP01_09_v1: 1884013 の変異体、L845F アミノ酸変化を引き起こす MDR1 遺伝子 (PVP01_1010900) の PvP01_10_v1:480601 の変異体、および PvP01_14_ の変異体v1:1229487 でS1136I アミノ酸変化を引き起こす PVP01_1428700。 さらに 6 個の SNP が GEO33 パネルと GEO50 パネルの間で重複し、13 個の SNP が GEO50 パネルと GEO55 パネルの間で重複しました。 2 つのパネル間で重複する SNP の中で、最も注目に値するのは、スルファドキシン耐性に関連する A553G アミノ酸変化を引き起こす PPPK-DHPS 遺伝子 (PVP01_1429500) の PvP01_14_v1:1270401 のバリアントです。

六角形はデータセットを反映し、四角形はプロセスを反映し、三角形は SNP セットを反映し、楕円形は結果を反映し、ひし形は Web ベースの分類子アプリケーションを反映します。 BR38 Broad バーコードは、42 の Broad SNP のうち、アッセイ可能な 38 の SNP を反映しています。 GEO33 セットは、FST 閾値 0.9 の HFST アプローチから得られた高性能 SNP を反映しています。 GEO50 セットは、閾値 FST が 0.95 の HFST アプローチからの高性能 SNP を反映しています。 GEO55 セットは、デシジョン ツリー アプローチによって選択された SNP を反映しています。

BR38、GEO33、GEO50、GEO55、および BR38 と 3 つの新しい GEO パネルの組み合わせ (つまり、GEO33 + BR38、GEO50 + BR38、および GEO55 + BR38) の分類パフォーマンスは、BALK を使用した 10 分割交差検証によって分析されました。データセット 3 のサンプルの分類器。データセット 3 の評価結果を図 2 に示します (ソース データは補足データ 1 に提供)。相互検証のコンセンサス結果を反映する MCC 中央値は表 1 にまとめられています。 BR38 バーコードは、プールされた (国全体の) MCC 中央値が最も低く (MCC 中央値 = 0.84)、続いて GEO33 (MCC 中央値 = 0.94)、GEO50 および GEO55 (両方とも MCC 中央値 = 1.00) でした。 GEO パネルと BR38 パネルを組み合わせたプールされた MCC 中央値はすべて 1.00 を超えましたが、GEO50 と GEO55 ではわずかな改善しか得られませんでした。 MCC中央値が0.8を超える国の割合は、BR38では62%(13/21)、GEO33およびGEO33+BR38では90%(19/21)、GEO50、GEO55、GEO50+では95%(20/21)でした。 BR38とGEO55+BR38。 予測性能が最も低かった国はベトナムとカンボジアでした。 ベトナムは、すべての SNP パネルで MCC 中央値 < 0.8 を示しました。 カンボジアは、BR38、GEO33、GEO33 + BR38 で MCC 中央値 < 0.8 を示しました。 6 か国 (フィリピン、ミャンマー、マレーシア、タイ、パプアニューギニア、バングラデシュ) では、BR38 では MCC 中央値が 0.8 未満でしたが、すべての GEO 組み合わせでは 0.8 を超えていました。

箱ひげ図は、各 SNP セットの層別 10 分割交差検証による 500 回の反復からの MCC スコアを示しています。 国のラベルは Y 軸に表示されます。 中央値と最小値は、すべての国でプールされた MCC スコアのそれぞれの要約統計量を反映しています。 各バーは、特定の国とモデルの中央値、四分位範囲、最小および最大 MCC を示します。 BR38 パネルは一般に、最も低い MCC スコア (つまり、最も低い予測精度) を示しました。 新たに選択されたパネルの中で、一般に GEO55 が最も高い MCC スコアを与え、次に GEO50、次に GEO33 でした。 GEO パネルに BR38 パネルを追加しても、一般に、MCC 中央値の増加は、たとえあったとしてもわずかしかありませんでした。 分析は、n = 799 の生物学的に独立したサンプルに基づいています。

BR38 バーコード、GEO33、GEO50、GEO55、および BR38 と 3 つの新しい GEO パネル (つまり、GEO33 + BR38、GEO50 + BR38、および GEO55 + BR38) の組み合わせのパフォーマンスを、異なるレベルの遺伝子型失敗で比較するために、10% をシミュレートしました。 、データセット 3 を使用して各国の 20% と 30% の欠損データの割合を調べ、BALK 分類器を使用して 10 分割相互検証を実行しました。 シミュレートされたジェノタイピングの失敗は、GEO33 バーコードに最も大きな影響を与えました (図 3 および補足データ 2、補足表 6 の付随ソースデータ)。 GEO33 のプールされた (国全体の) MCC 中央値は、欠損データなしの 0.96 から、それぞれ 10%、20%、30% の欠損データがある 0.89、0.81、および 0.73 に低下しました。 GEO33 + BR38 パネルを組み合わせた場合の欠損データの影響は低く、プールされた MCC 中央値は、欠損データがない場合の 1.00 から、それぞれ 10%、20%、および 30% の欠損データがある場合の 0.98、0.96、および 0.94 に低下しました。 他のすべてのパネルでは、プールされた MCC 中央値は、遺伝子型コールの欠落なし (0%) と 30% のシミュレーション間で 0.1 以上低下しました: BR38 では 0.87 から 0.77、GEO50 では 0.96 から 0.85、GEO55 では 0.98 から 0.89、そして 1.00 GEO50 + BR38 および GEO55 + BR38 では 0.98 まで。

国ごとに n = 25 の生物学的に独立したサンプルを使用した 250 のリピートから生成された MCC スコア (a) 欠損データなし (0%)、および 10% (b)、20% (c)、および 30% ( d); 中央値と最小値は、すべての国でプールされた MCC スコアのそれぞれの要約統計量を反映しています。 各バーは、特定の国とモデルの中央値、四分位範囲、最小および最大 MCC を示します。 データが欠損している場合、BR38 パネルと GEO パネルを組み合わせたもの (つまり、BR38 + GEO33、BR38 + GEO50、および BR38 + GEO55) は、予測性能の維持において単一パネルよりも優れた結果を示しました。これは、おそらく一部の SNP 間の中程度のレベルの冗長性によるものと考えられます。

低品質でインポートされた疑いのあるサンプルを除外した後、トレーニングに含まれていない (つまり、データセット 1、2、または 3 に含まれていない) 合計 142 個のサンプル (独立検証データセット) を候補者のパフォーマンスを独立して評価するために利用できました。トレーニングされた分類器を備えた SNP パネル。 独立検証データセットは、トレーニング データセット (データセット 2) に含まれる 7 か国のそれぞれからのサンプルで構成されていました。 トレーニング データセットに対する独立検証データセットの地理的クラスタリング パターンは、補足図 3 の隣接結合ツリーに示されています。トレーニングされた分類器を使用した SNP パネルでの独立検証データセット内のサンプルの予測パフォーマンスは、次の図に示されています。表 2. BR38 パネルは予測精度が最も低く、プールされた (国全体の) MCC 中央値は 0.44 でした。 GEO33 パネルも一般に低い予測精度 (プール中央値 MCC = 0.64) を示しましたが、これは GEO33 + BR38 パネルを組み合わせたものでは改善されました (プール中央値 MCC = 0.81)。 GEO50、GEO55、GEO50 + BR38、および GEO55 + BR38 パネルはすべて、プールされた MCC 中央値が 0.80 (範囲 0.83 ~ 0.89) を超える、一般に高い予測精度を示しました。 図 4 は、各 SNP パネルのヒート マップを示しており、原産国ごとの正しいリコールの割合を示しています (ソース データは補足データ 3 に提供されています)。 ヒート マップは、すべての SNP パネルにおいて、誤った分類が一般的に近隣諸国への予測を反映しており、その結果、地域の地理マッピングの精度が保たれていることを示しています。

各プロットは、独立検証データセット (n = 142 の生物学的に独立したサンプル) 内の特定の SNP パネル (パネル a ~ g) の予測パフォーマンスを、原産国と予測の間の相関関係を示すヒートマップとして視覚化して表示します。 各セルは、対応する予測国に正しく割り当てられた特定の原産国からのサンプルの割合を反映するように色分けされています。 水色 (割合が低い) から濃い青 (割合が高い) までの色分け。 少なくとも 1 つの SNP パネルによって予測された国のみが表示され、独立検証セットに含まれていない (つまり、原点軸上にない) 予測国は赤色でラベル付けされます。 サンプルの原産国が予測の国と直接一致しない場合、通常は近隣諸国 (つまり、依然として正しい地域地理内) にマッピングされます。 BR38 パネルは、GEO および GEO + BR38 パネルの組み合わせよりも低い予測精度を示しました。 SNP パネル全体で、誤った予測の大部分はカンボジア、ベトナム、タイの間で発生しました。

この研究の主な目的は、輸入された三日熱マラリア原虫感染を特定し、マッピングするために使用できる、集団ベースの監視フレームワークに適した分子ツールを開発することでした。 3 つの新しい SNP パネル (GEO バーコード) が高い国分類パフォーマンスで特定され、さまざまな風土病シナリオにわたって輸入された三日熱マラリア原虫感染を区別できました。 最も節約的なパネルである GEO33 は、欠損データがない場合に高い国分類を示し、中程度のレベルの SNP を含むサンプルの予測能力を向上させるために、38 個の両対立遺伝子でアッセイ可能なブロード バーコード SNP (BR38) に費用対効果の高い方法で追加できます。データがありません。 GEO33 + BR38 バーコードを組み合わせることにより、欠損データの割合が 30% に上昇した場合でも、ほとんどの流行地域で堅牢な国分類が生成されました。 しかし、カンボジアとベトナムの間の GEO33 + BR38 バーコードの予測能力は中程度であり、おそらくこれら 2 国の国境を越えるヒトおよび関連する三日熱マラリア原虫遺伝子の頻繁な流入を反映していると考えられます。 GEO50 および GEO55 パネルは、これらの領域で GEO33 + BR38 パネルよりも優れた解像度を達成しており、血統による同一性の分析に適した追加のマーカーを使用すると、高レベルの遺伝子流動による国境を越えた寄生虫の伝播をさらに詳細に特徴付けることが可能になる可能性があります 17。 一部の地理的地域では、国境が寄生虫の遺伝子流動にほとんどまたはまったく障害を及ぼさないため、ゲノム規模のデータであっても隣国間の感染を解決することはできません。これらの地域では、感染源の国レベルの分類の有用性は限られている可能性があります。 しかし、遺伝子データを使用して、国境の異なる側から来た寄生虫が単一の均質な集団を形成していることを実証することは、三日熱マラリアに取り組むための国境を越えた協力的な取り組みの根拠を強化するのに役立つ可能性があります。 さらに、この研究で説明されているツールは、NMCP に関連する可能性のある他の集団境界を特徴付けるために適応させることができます。 三日熱マラリア原虫に関する利用可能なゲノム データの密度が増加するにつれて、分類目的でより高解像度の遺伝的に定義された感染境界を使用することも可能になる可能性があります。

新しい GEO バーコードの適用と広範な検証が進行中であり、イルミナのアンプリコンベースのシーケンスアッセイは、ウェルカム サンガー研究所の 38 ブロード バーコード SNP 用マラリア プログラムと GEO 用のアントワープ熱帯医学研究所の協力者によってすでに確立されています。 -3318。 NMCP の日常活動に寄生虫のジェノタイピングを導入するための枠組みを確立するには、さらなる作業が必要である。大都市のいくつかの国で NMCP 活動に寄生虫のジェノタイピングを導入することに成功した GenRe-Mekong フレームワークから洞察が得られる可能性がある。熱帯熱マラリア原虫の抗マラリア薬耐性を追跡することを目的としたメコン川流域7。 GenRe-Mekong フレームワークは現在、強力な分子生物学の専門知識と設備を備えた集中研究所 (国家基準研究所など) でイルミナ プラットフォームを使用してジェノタイピングを実施することに重点を置いています。 ただし、この研究で説明されている地理的バーコードのアッセイは、携帯性の高い minION シーケンサー (Oxford Nanopore Technologies) などの他のジェノタイピング プラットフォーム用に容易に設計でき、理論的には最小限の分子実験装置を備えた環境で実装できます。

「現実世界」のジェノタイピング データの分析と解釈では、乾燥した血液スポットから収集されたサンプルなどの低品質サンプルから大きな課題が生じます。 これらのニーズを見越して、私たちはポリクローナル感染や欠損データに対処できる能力を備えた尤度ベースの分類子フレームワークを確立しました。 このフレームワークは vivaxGEN-geo オンライン プラットフォーム (http://geo.vivaxgen.org) に統合されているため、ユーザーは複雑なバイオインフォマティクスのスキルを必要とせず、隣接する樹木や樹木の主観的な目視検査を回避してデー​​タを分析および解釈できます。主成分プロット。 vivaxGEN-geo に実装された情報ツールは P. vivax に合わせて調整されていますが、同様のアプローチを他の種にも適用できます。 より広範なアプリケーションを促進するために、ソース コードは公開されています。

GEO SNP パネルの変異体は、さまざまな機能を表す遺伝子内に位置しており、薬剤耐性関連遺伝子の変異体など、時間の経過とともに不安定になるものもあります。 これらの変異体は、個体群が進化するにつれて新しい変異体に容易に置き換えられます。 集団内の対立遺伝子の頻度が変化する速度は、集団のサイズ、遺伝子流動の程度、選択のダイナミクスなどのさまざまな要因に依存します。

私たちのデータセットは、現在入手可能な三日熱マラリア原虫分離株の最も地理的に多様なパネルの 1 つを表しており、すべての主要な三日熱感染症流行地域が示されていますが、派生ツールの予測能力は、参照パネルの地理的表現によって制限される可能性があります。 。 分類器は、遺伝的参照パネルに代表されていない国に予測を割り当てることはできません。また、参照サンプル セットが少ないか代表的ではない国では、分類精度が制限される可能性があります。 インド亜大陸などの地域からの参加者が限られているということは、埋める必要がある重要なギャップです。 しかし、参照パネルには、メフロキン耐性に関連した三日熱マラリア原虫感染が高頻度で発生しているパプアインドネシア、タイ西部、ミャンマーにおけるクロロキン耐性三日熱マラリア原虫の中心地など、公衆衛生に関連する地域からの分離株がよく示されている。 MDR1 (PVP01_1010900) のコピー数変異が報告されており、エチオピアではアフリカ最大の三日熱マラリア原虫の保有地であり、ダフィー陰性ヒト赤血球に侵入する可能性のある感染症が報告されている19、20、21、22、23。 、24。 遺伝的参照パネルにおけるこれらの領域の強力な表現により、NMCP はこれらの領域から感染が持ち込まれた時期を正確に特定し、適切な症例管理応答を行うことができます。 また、尤度ベースの分類子フレームワークは、新しいゲノムデータが利用可能になったときに現在のメーカーセットの再評価に適しており、洗練された SNP パネルの反復開発を促進することを認識することも重要です。 バーコード SNP で生成されるデータが増加して参照パネルが拡大するにつれて、尤度に基づく分類の精度が向上します。

尤度ベースの分類子フレームワークは、流行地域で一般的である 2 つ以上のクローンを保持するポリクローナル感染に地理的予測を割り当てることができるように設計されています。 これらの感染症は通常、集団の遺伝的分析から省略されます。 ただし、分類子は個々のクローンを段階的に分類しようとするものではなく、むしろ感染を複合体として分析し、最も可能性の高い起源の単一の予測を生成することを認識する必要があります。 それにもかかわらず、設計上、フレームワークによって選択される GEO パネルは、国内での多様性が低い(多様性はむしろ国家間にある)はずであることに注意することが重要です。 したがって、単一の国に由来するポリクローナル感染では、選択した GEO バーコードでヘテロ接合体の位置が低頻度で示されるはずです。 単一の感染症内に異なる国に由来するクローンの組み合わせが存在し、多くのヘテロ接合体位置が得られる場合、分類器は原産国を検出する能力が制限され、それに応じて予測の信頼性が低くなります。 GEO マーカーとマイクロハプロタイプなどの高解像度フィンガープリンティング マーカーを組み合わせた将来の開発により、ポリクローナル感染を段階的に分類し、その後地理的起源を分析できる可能性があります。

新しい地理的マーカーと同様に、他のユースケースに対応するために、SNP バーコードの将来の反復が開発されています。 これらには、薬剤耐性三日熱マラリア原虫のマーカーや再発性感染症を特徴付けるマーカーが含まれ、臨床試験、疫学コホート、寄生虫サーベイランスの解釈をサポートします(8 のマイクロハプロタイプの説明を参照)。 三日熱マラリア原虫感染の地理的起源は、寄生虫の再発の可能性の高い周期性についてある程度の洞察を提供する可能性がありますが、再発感染のリスクと頻度は、伝播強度、ヒプノゾイト負荷、宿主免疫など、寄生虫間の相関関係を混乱させるさまざまな要因によって影響されます。遺伝子型と個人の再発リスク4,25。

2017 年には、三日熱マラリア原虫感染が優勢なアジア太平洋地域、中東、南北アメリカのマラリア常在 17 か国で確認されたマラリア症例の最大 100% が輸入感染であると報告されています1。 これらの国々では、国家マラリア対策プログラムが分子ツールから得られた情報を利用して、地域での伝播を減らすための進行中の介入の有効性を評価することができます。 マラリア撲滅を認定するための世界保健機関による重要な要件の 1 つは、少なくとも連続 3 年間に国内で検出されたすべてのマラリア症例が輸入されたものであることを証明することです。 当社のジェノタイピングアプローチは、輸入された感染症を特定できる可能性があり、排除認定における曖昧さを軽減します。 この目的のために、撲滅に近づいている国々は、推定輸入症例との将来の分子比較のためにアーカイブサンプルを維持する必要がある。

提示された分子的三日熱マラリア原虫地理分類ツールは、マラリア流行国のユーザーが地域の遺伝子型解析データを世界中で利用可能なデータセットと比較できるように設計されています。 アンプリコンに基づく地理的バーコードの配列決定は、アジア太平洋マラリア撲滅ネットワーク (www.apmen.org) の流行パートナー国の中央研究所で他の監視マーカーと組み合わせられます。 これらのセンターから生成されたデータは、研究者、国家マラリア対策プログラム、その他の主要な関係者に、輸入マラリアの発生率、疫学、主要な感染源に関する情報を提供し、そうすることで、リソースを最も必要としている場所にターゲットを絞るのに役立ちます。

このプロジェクトは、2 つの主要な成果を生成することを目的としていました。1 つは三日熱マラリア原虫の地理的バーコード (つまり、マーカーの選択) を識別するための新しいフレームワーク、もう 1 つはバーコードを使用して生成されたデータをエンドユーザーが分析するためのオンラインのオープンアクセス情報学プラットフォームです。 三日熱マラリア原虫の地理的バーコードの識別に含まれる手順の概要を示すフロー図を図 1 に示します。このプロセスには 3 つの重要な手順が含まれます。 1) サンプル数と SNP の数の最適なバランスを持ち、欠落のないデータセットを作成するためのデータ準備2) この研究で開発された分類器 (Bi-Allele Likelihood、BALK 分類器) に適した候補 SNP パネルを取得するためのデシジョン ツリーおよび HFST アプローチを使用した SNP 選択、および 3)候補 SNP パネル、欠損データの影響 (つまり、遺伝子型の失敗) の評価、および独立したデータセットによる予測精度の評価。 次に、オンラインのオープンアクセス情報学プラットフォームが開発され、候補 SNP パネルに対してトレーニングされた BALK 分類器が装備されました。 メソッドのより包括的な説明は、補足メソッドで提供されます。

この研究では、オープンデータセットとして最近公開されたマラリアゲノム疫学(MalariaGEN)三日熱マラリア原虫ゲノム変異プロジェクトリリース 4(Pv4)に由来する三日熱マラリア原虫のゲノムデータを使用しました26。 Pv4 オープン データ セットは 26 か国のゲノムで構成されています。 分析を実施した時点 (つまり、Pv4 オープン アクセス リリース前) では、(リリースに記載されている 1895 サンプルのうち) 1873 サンプルを含むデータセットが研究に利用可能でした。 この研究の分析では、データセットはトレーニング データセットと検証データセットの 2 つの部分に分割されました。 検証セットは、GlaxoSmithKline (GSK) によって実施された臨床試験に由来する 7 か国 (ブラジル、カンボジア、コロンビア、エチオピア、ペルー、タイ、ベトナム) の分離株で構成されていました 26。 残りのすべての分離株は、検証セット内のすべての国を表すトレーニング データセットに含まれていました。 GSK サンプルは、この研究のサンプルが他の研究よりも後に配列決定され、データが後で利用可能になったため、便宜上、独立した検証のために選択されました。

データ準備手順の概要は、図 1 に示されているフローチャートのセクション a) に概説されています。簡単に説明すると、トレーニング データセットはフィルター処理され、再発感染と 4 つ未満の独立した三日熱マラリア原虫ゲノムで代表される国からのサンプルが除外されました。 21 か国の 1,348 サンプルで構成される初期データセット (補足表 1、補足図 4)。 この初期データセットを使用して、MalariaGEN Pv4 プロジェクト 26 で発見された最初の 2,671,112 個の変異体から、VQSLOD スコア > 0、最小深さ 1、最小マイナー対立遺伝子数 (MAC) 2 を持つ 662,641 個の高品質の両対立遺伝子 SNP のセットを導き出しました。両対立遺伝子 SNP への制限は、下流の計算を簡素化するためにマラリア集団ゲノミクスで行われる標準的なアプローチであり、ポリクローナル感染の分析に制約を課すものではありません。ポリクローナル感染は、それぞれの遺伝子間の対立遺伝子変異の複合体を通じて依然として検出可能です。 SNP (27、28、29 を参照)。 個々の遺伝子型コールは、マイナー対立遺伝子比 > 0.1 と各対立遺伝子の最小 2 リードという任意の閾値に基づいてヘテロ接合体として定義されました。 他のすべての遺伝子型コールは、主要対立遺伝子のホモ接合性として定義されました。 データセット 0 はさらにフィルタリングされて、遺伝的距離が 0.001 未満の分離ペアとして任意に定義された非独立サンプルを除外し、その結果、662,641 個の SNP を持つ 1,227 個のサンプルが得られ、データセット 1 として示されました。その後、データセット 1 に反復データ品質フィルタリングを適用して、欠損が大きいサンプルを繰り返し除去し、残りのサンプルから有益な SNP (MAC > = 2 の SNP として定義される) の数を計算することにより、遺伝子型欠損のないサンプルと有益な SNP の最も代表的な数を求めます。 このデータ品質フィルタリングの結果のプロット (補足図 1) に基づいて、データセット 2 に含まれる 826 個のサンプルと 229,317 個の SNP を特定しました。 データセット 2 の分離株は、利用可能なメタデータに基づいて最初に国に割り当てられました。 1) 229,317 のすべての SNP に対する BALK 分類子を使用した国レベルの予測、および 2) 遺伝的距離に基づいて隣接結合ツリーを構築することによる手動確認を使用してさらに評価されました。 国割り当てが予測結果と異なり、隣接結合ツリーから手動で観察されたのと同じ国クラスターに属さない分離株は、輸入感染が疑われるとみなされ、データセットから削除されて、799 サンプルと 229,317 SNP で構成されるデータセット 3 が作成されました。 候補 SNP パネルの比較評価のために、データセット 3 のサンプルで構成される新しいデータセット (データセット 4) が作成されましたが、連続する SNP 選択プロセス (これらの SNP パネルを GEO バーコードと呼びます) によって選択された SNP のみと、アッセイ可能な 38 個の SNP のみが含まれています。 Broad Institute によって開発された一般的に使用される 42-SNP P. vivax バーコードの SNP 12。 38 個のアッセイ可能な Broad Institute バーコード SNP からなる SNP パネルは、BR38 と呼ばれます。 BR38 SNP パネルは、いくつかの国で実施されているため、新たに選択された GEO SNP パネルと組み合わせて、単独で評価するために研究に統合されました。

同様のフィルタリング プロセスが検証セットに適用されました。 すべての再発感染が除去され、トレーニング データセット 4 で定義された 229,317 個の SNP のみが含まれるように SNP の位置がフィルター処理されました。その後、記載された手順と同様の手順を使用して、同じ遺伝的距離の 0.001 閾値を使用して残りの非独立サンプルが除去されました。トレーニングセットに。 国レベルの割り当ては、トレーニング セットと同じトレーニング済み BALK 分類器を使用して評価され、手動確認のためにデータセット 3 と組み合わせて隣接結合ツリーが構築されました。 さまざまなフィルターの後、142 個のサンプルのセットが検証セットに残りました。 補足図 2 は、229,317 個の SNP での 142 個の検証サンプルと組み合わせたデータセット 3 の隣接結合ツリーを示しています。 BR38 パネルと新しく選択された GEO SNP のみを含むようにさらに SNP フィルタリングを実行して、独立検証データセットを作成しました。 データ準備方法の詳細については、補足方法を参照してください。

私たちの研究では、三日熱マラリア原虫感染症/遺伝子データを国ごとに分類する柔軟な方法の開発が必要でした。 この目的のために、次の特性を持つ分類器が必要でした。1) 既存の SNP パネルを評価できる、2) 新しい国や時間の経過による遺伝的変化に対応するための新しい SNP の追加に適している、3) 遺伝子型の失敗を含むデータ入力を分類できる、およびポリクローナル感染から生じる両対立遺伝子ヘテロ接合遺伝子型呼び出し、および 4) 予測の信頼値を提供できます。 いくつかの修正を適用した後、Naive Bayes 分類器が上記の要件を満たす特性を持つことを確認しました。 ヘテロ接合性コールを処理するために分類ルールの尤度方程式をベルヌーイ確率分布から二項 N = 2 分布に置き換え、事前確率を一様分布により、分類子は SNP データの尤度のみに依存します。 BALK 分類ルールは式 1 に示されています。

ここで、X はサンプルの SNP データセット、C はグループ (または国)、xi は位置 i の代替対立遺伝子の数、pi は二倍体サンプルとしてカウントされた国 C の位置 i の代替対立遺伝子の頻度です。 。 BALK 分類器の開発のより包括的な説明は、補足メソッドとして利用できます。

私たちの目的は、国レベルの分類において最も節約的な SNP パネルを特定することであり、これらのパネル内の SNP が 60 未満になることを目指しました。 新しい SNP パネルのこのしきい値は、いくつかの考慮事項に基づいています。 イルミナプラットフォームの多重化機能に従って、プライマー、ライブラリーの調製および配列決定のコスト、さらには多数のプライマーにわたる PCR プールの調製という実際的な課題を考慮して、合計で最大 100 個の SNP を同定しました(新しい SNP 全体にわたって)。パネルと、三日熱マラリア原虫の地理的バーコードの実行可能な閾値として以前に説明されたブロード バーコード、すなわち BR38) を使用します。

候補 SNP 選択ステップの概要は、図 1 に示すフローチャートのセクション b) に概説されています。国分類に最適な SNP は、次のアプローチを使用して選択されました: DecisionTree、HFST-0.90 および HFST-0.95 (Fst 閾値がそれぞれ 0.9 と 0.95)、補足方法で詳しく説明されています。 簡単に言うと、DecisionTree (DT) アプローチでは、データセット 3 に Python sklearn ライブラリの DT 実装が適用されました。 次に、DT によって選択された SNP セットは、国レベルの MCC (マシュー相関係数) スコアと、プールされた (国を越えた) 中央値および最小 MCC スコアを使用して、トレーニング セット内の BALK 分類器で再評価されました。 MCC は、-1 (完全な不一致) から 1 (完全な予測) までの範囲の分類の品質の尺度を提供します30。 HFST(階層FST)アプローチの場合、分岐ツリーガイドとして、Neiの正味平均人口遺伝距離行列に基づいて近隣結合人口ツリーが構築され、中間点で再ルートされました(補足図5)。 HFST アプローチでは、分岐ガイド ツリーを横断し、ブランチの 2 つのノードで表される 2 つの集団間で特定のしきい値より高い FST を持つ SNP をランダムに選択する必要がありました。 ガイド ツリーのトラバース中にしきい値を超える SNP がなかった場合は、DT 法を使用して追加の SNP を取得し、ブランチの 2 つのノードを分離しました。 DT アプローチと同様に、データセット 3 で選択された SNP に対してトレーニングされた BALK 分類器を使用して、選択された各 SNP セットの国レベルの MCC スコアとプールされた (国を越えた) 中央値と最小の MCC スコアが計算されました。

各アプローチでは、データセット 3 をトレーニングとテストの両方に 500 回繰り返して使用し、500 の SNP セットを取得しました。 500 の SNP セットから上位 25 の SNP セットが収集され、国レベルの MCC スコアに対する最小 MCC スコアと中央値 MCC スコアの平均に基づいてランク付けされ、階層化された 10 分割交差検証を 500 回繰り返して、平均最小 MCC スコアと中央 MCC スコアに基づいて再ランキングすることで各 SNP セットをオーバーフィットし、各アプローチに最適な SNP セットを導き出します。

SNP パネルの比較評価に含まれる手順の概要は、図 1 に示すフローチャートのセクション c) に概説されています。Broad SNP パネルを、DT、HFST-0.90、および HFST-0.95 アプローチでは 500 リピートで、データセット 3 を使用して各 SNP パネルで層別 10 分割交差検証を実施しました。

さらに、さまざまなレベルの欠損データ (遺伝子型解析の失敗と同様) を含む候補 SNP パネルの予測パフォーマンスの耐久性を評価するために、遺伝子型データをランダムに削除した後にシミュレーションを実行しました。 BALK 分類子は、すべてのサンプルを使用して候補 SNP パネルに対してトレーニングされました。 各国ごとに、25 個のサンプルが置換によりランダムにサンプリングされ、遺伝子型コールが SNP セットから 10%、20%、および 30% の割合で削除されました。 次に、ランダムなサンプルに対して、トレーニングされた分類器が適用されました。 このプロセスは 250 回繰り返し実行され、各国の予測の MCC スコアが報告されました。

(相互検証戦略の再サンプリング手法を使用するのではなく) 新しいサンプル セットを使用して候補 SNP パネルのパフォーマンスを評価するために、トレーニング済みの BALK 分類器が独立検証データセット上で実行され、各国ごとに報告された MCC スコアが作成されました。

エンドユーザーが利用できる情報学ツールを確立するために、さまざまなバーコードから得られた遺伝データを使用してサンプルの最も可能性の高い原産国を決定するためのデータ分類ツールを組み込んだオンライン プラットフォームが作成されました。 マイクロ衛星ベースの P. vivax データ共有および分析プラットフォーム 31 用に開発された既存のソース コードは、地理的バーコードで生成された SNP データを照合するために、新しい Web ベースのプラットフォーム (vivaxGEN-geo) を作成するために変更されました。 このアプローチは、i) 将来のバーコードの漸進的改善を可能にする手動 SNP セットの組み込み、ii) 遺伝子型解析の失敗による不完全なデータを含むバーコードの評価、および iii) ポリクローナル感染を反映するヘテロ接合遺伝子型コールの評価を行うことができるため、選択されました。 最適な精度を実現するために、オンライン プラットフォームで提供される BALK 分類器は、データセット 2 (N = 799) と独立検証データセット (N = 142) で構成される 941 サンプルでトレーニングされています。 分類ツールは、原産国の可能性が最も高い 3 つとそれに関連する確率を報告します。 分類ツールは、原産国の可能性が最も高い 3 つとそれに関連する確率を報告します。 確率は、sklearn ライブラリの CalibratedClassfierCV に実装されているアイソトニック法を使用し、キャリブレーション データセットの層別 4 分割交差検証を使用して計算されました。 Web プラットフォームは、文字列ベースのバーコード表現、列ベースのタブ区切りテキスト ファイル、および VCF ファイルで入力データを受け取ることができます。

すべてのサンプルは、マラリアゲノム疫学 (MalariaGEN) P. vivax Genome variation Project release 4 data note26 に詳述されているように、患者またはその法的保護者から書面によるインフォームドコンセントを得て収集されました。

研究デザインの詳細については、この記事にリンクされている Nature Portfolio Reporting Summary を参照してください。

この研究では、MalariaGEN 三日熱マラリア原虫ゲノム変異プロジェクト リリース 4 (Pv4)26 のゲノム データを使用しました。 研究で使用された遺伝子型コールを含む VCF および zarr 形式のファイルは、MalariaGEN データ リソース ページ (https://www.malariagen.net/resource/3026) からオープン アクセスで入手できます。

データのフィルタリング、分析、視覚化に使用されるすべてのカスタム社内スクリプトは、https://github.com/vivaxgen/geo から入手できます。 VivaxGEN-geo Web サービスには、http://geo.vivaxgen.org/ からアクセスできます。 この研究で説明されている新しい地理的 SNP パネルに加えて、vivaxGEN-geo は、公開されているベトナム語バーコード (VN40)18 を含む他の SNP パネルの分類を提供します。

誰が。 世界マラリア報告書 2016。世界保健機関。 ジュネーブ 2016。(2016)。

トリプラ、R. et al. カンボジア西部の人口における熱帯熱マラリア原虫および三日熱マラリア原虫の持続感染:予防、治療、排除戦略への影響。 マラー。 J. 15、181 (2016)。

記事 Google Scholar

コー、S.ら。 人間の脾臓に存在する無傷のマラリア原虫の隠れたバイオマス。 N.Engl. J.Med. 384、2067–2069 (2021)。

記事 Google Scholar

ニュージャージー州ホワイト&M・イムウォング再発。 上級パラシトール。 80、113–150 (2012)。

記事 Google Scholar

Auburn, S.、Cheng, Q.、Marfurt, J. & Price, RN 三日熱マラリア原虫の疫学の変化: 従来型および新規の監視ツールからの洞察。 PLoS医学。 18、e1003560 (2021)。

記事 Google Scholar

Sattabongkot, J.、Tsuboi, T.、Zollner, GE、Sirichaisinthop, J. & Cui, L. 三日熱マラリア原虫感染: 制御のチャンス。 トレンドパラシトール。 20、192–198 (2004)。

記事 Google Scholar

ジェイコブ、CG 他マラリアの制御と撲滅を支援するための大メコン川流域と南アジアにおける遺伝子監視。 eLife 10、https://doi.org/10.7554/eLife.62997 (2021)。

Noviyanti、R. et al. 国家監視枠組みへの寄生虫のジェノタイピングの導入: アジア太平洋地域の管理プログラムと研究者からのフィードバック。 マラー。 J. 19, 271 (2020)。

記事 Google Scholar

ディエス・ベナベンテ、E. 他三日熱マラリア原虫のゲノム変異により、選択圧下にある領域が明らかになります。 PloS one 12、e0177134 (2017)。

記事 Google Scholar

岩上正人ほか韓国における三日熱マラリア原虫の地理的起源: 寄生虫のミトコンドリア ゲノムに基づくハプロタイプ ネットワーク分析。 マラー。 J. 9、184 (2010)。

記事 Google Scholar

ロドリゲス、PT et al. ミトコンドリアのゲノム配列を使用して、米国で診断された輸入された三日熱マラリア原虫感染の起源を追跡します。 午前。 J.熱帯医学。 ヒュグ。 90、1102–1108 (2014)。

記事 Google Scholar

Baniecki, ML et al. 三日熱マラリア原虫感染症の遺伝子型を特定するための一塩基多型バーコードの開発。 PLoSは熱帯地域を無視しました。 9、e0003539 (2015)。

記事 Google Scholar

Ba、H.ら。 多座位遺伝子型解析により、西アフリカのモーリタニアにおける地理的に異なる三日熱マラリア原虫集団の確立された風土病性が明らかになりました。 PLoSは熱帯地域を無視しました。 14、e0008945 (2020)。

記事 CAS Google Scholar

デワスレンドラ、RL et al. スリランカにおけるゲノム監視と寄生虫追跡のための三日熱マラリア原虫の遺伝子バーコードの使用。 マラー。 J. 19, 342 (2020)。

記事 CAS Google Scholar

ディエス・ベナベンテ、E. 他三日熱マラリア原虫の地理的起源と伝播動態を知らせる分子バーコード。 PLoS ジュネット。 16、e1008576 (2020)。

記事 Google Scholar

Price, RN、Auburn, S.、Marfurt, J. & Cheng, Q. 薬剤耐性三日熱マラリア原虫の表現型および遺伝子型の特徴付け。 トレンドパラシトール。 28、522–529 (2012)。

記事 CAS Google Scholar

テイラー、AR 他血統別の同一性を使用して、局所的な熱帯熱マラリア原虫個体群間の接続性を定量化します。 PLoS ジュネット。 13、e1007065 (2017)。

記事 Google Scholar

カッテンバーグ、JH et al. 複数の地理的スケールでの三日熱マラリア原虫遺伝子監視ユースケース向けの、高度に多重化された新しい AmpliSeq ターゲット アッセイ。 フロントセル感染。 微生物 12、953187 (2022)。

記事 CAS Google Scholar

オーバーン、S.ら。 ゲノム解析により、タイにおける三日熱マラリア原虫多剤耐性 1 遺伝子座の増幅に共通のブレークポイントが存在することが明らかになりました。 J.感染する。 Dis.、https://doi.org/10.1093/infdis/jiw323 (2016)。

オーバーン、S.ら。 エチオピア南部における三日熱マラリア原虫のゲノム分析により、複数の寄生虫メカニズムにおける選択圧が明らかになりました。 J.感染する。 ディス。 220、1738–1749 (2019)。

記事 CAS Google Scholar

メナード、D. et al. 三日熱マラリア原虫による臨床マラリアは、ダフィー陰性のマダガスカル人によく観察されます。 手順国立アカデミー。 科学。 USA 107、5967–5971 (2010)。

記事 CAS Google Scholar

ペンシルバニア州ジマーマン アフリカのダフィー陰性の人における三日熱マラリア原虫感染。 午前。 J.熱帯医学。 ヒュグ。 97、636–638 (2017)。

記事 Google Scholar

プライス、RN 他クロロキン耐性三日熱マラリア原虫の世界規模 - 著者らの回答。 ランセット。 感染する。 ディス。 15、630–631 (2015)。

Google スカラー

ラトクリフ、A.ら。 インドネシアのパプア南部におけるクロロキンおよびスルファドキシンピリメタミンに対する多剤耐性熱帯熱マラリア原虫および三日熱マラリア原虫の治療反応。 トランス。 R. Soc. トロピカルメッド。 ヒュグ。 101、351–359 (2007)。

記事 CAS Google Scholar

Commons, RJ、Simpson, JA、Watson, J.、White, NJ & Price, RN 再発による三日熱マラリア原虫再発の割合の推定: 体系的レビューとメタ分析。 午前。 J.熱帯医学。 ヒュグ。 103、1094–1099 (2020)。

記事 CAS Google Scholar

MalariaGen et al. 世界中の 1,895 サンプルにおける三日熱マラリア原虫のゲノム変異のオープン データセット。 ようこそオープンRes. 7、136 (2022)。

記事 Google Scholar

ピアソン、RD 他。 三日熱マラリア原虫の局所的変異と最近の進化のゲノム分析。 ナット。 ジュネット。 48、959–964 (2016)。

記事 CAS Google Scholar

オーバーン、S.ら。 次世代配列データを使用した宿主内熱帯熱マラリア原虫の多様性の特性評価。 PloS one 7、e32891 (2012)。

記事 CAS Google Scholar

マンスケ、M.ら。 ディープシーケンシングによる自然感染症における熱帯熱マラリア原虫の多様性の分析。 ネイチャー 487、375–379 (2012)。

記事 CAS Google Scholar

Jurman, G.、Riccadonna, S.、Furlanello, C. マルチクラス予測における MCC と CEN の誤差測定値の比較。 PloS one 7、e41882 (2012)。

記事 CAS Google Scholar

リファレンスをダウンロードする

研究にサンプルを提供してくださった患者さん、サンプル収集を支援していただいた医療従事者および現場チームに感謝いたします。 また、ウェルカム サンガー研究所のサンプル ロジスティクス、シーケンス、情報学施設のスタッフの貢献にも感謝します。 オープンアクセスを目的として、著者は、この投稿から生じた著者が承認した原稿バージョンに CC BY 公共著作権ライセンスを適用しています。 この研究はウェルカム トラスト (RNP に授与された臨床科学の上級フェローシップ、200909) から一部資金提供を受けました。 この研究には、オーストラリア外務貿易省 (TDCRRI 72904)、オーストラリア国民健康医療研究評議会 (NHMRC) (SA に授与された APP2001083)、およびビル・アンド・メリンダ・ゲイツ財団 (OPP1164105) からも資金の一部が提供されました。 HT は、チャールズ ダーウィン大学国際博士課程奨学金 (CDIPS) によって支援されました。 患者のサンプリングとメタデータの収集は、アジア太平洋マラリア撲滅ネットワーク (108-07)、マレーシア保健省 (BP00500420)、NHMRC (1037304 および 1045156; NMA へのフェローシップ [1042072 および 1135820])、BEB [ 1088738] および MJG [1074795])。 MJG は、「ホット ノース」アース キャリア フェローシップ (1131932) からも支援されました。 MUF は、ブラジルの Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) からの上級研究員奨学金によって支援されています。 この研究の全ゲノム配列決定コンポーネントは、医学研究評議会および英国国際開発省からの助成金 (M006212) と、DPK に授与されたウェルカム トラスト (204911) およびウェルカム トラスト助成金 (206194/Z/17/Z) によって支援されました。 ) DPK と JCR に授与 この研究は、NHMRC (APP 1134989) の資金提供を受けたオーストラリアマラリア撲滅研究卓越センター (ACREME) の支援を受けました。

メンジーズ保健大学院およびチャールズ・ダーウィン大学、地球および熱帯保健部門、ダーウィン、ノーザンテリトリー、オーストラリア

ヒダヤット・トリマルサント、ジュッタ・マルフルト、ズレマ・パヴァ、マシュー・J・グリッグ、ブリジット・バーバー、ニコラス・M・アンスティ、ベネディクト・レイ、カマラ・スリーマー、リック・N・プライス、サラ・オーバーン

エイクマン分子生物学研究所、ジャカルタ、インドネシア

ヒダヤット・トリマルサント、エドウィン・スタント、リンティス・ノヴィヤンティ、レイリー・トリアンティ

ウェルカム サンガー研究所、ウェルカム ゲノム キャンパス、ケンブリッジ、英国

ロバート・アマト、リチャード・D・ピアソン、ジュリアン・C・レイナー、エレノア・ドゥルーリー、ソニア・ゴンザレス、ヴィクトリア・シンプソン、オリーブ・ミオット、アリスター・マイルズ、ドミニク・P・クウィアトコウスキー

Exeins Health Initiative、ジャカルタ、インドネシア

エドウィン・スタント

国際トレーニングおよび医療研究センター (CIDEIM)、カリ、コロンビア

ディエゴ・F・エチェベリー

コロンビア、カリ、デル・バレ大学微生物学部

ディエゴ・F・エチェベリー

イセシ大学、カリ、コロンビア

ディエゴ・F・エチェベリー

マラリア グループ、アンティオキア大学、メデリン、コロンビア

タチアナ M. ロペラ=メサ、リディア M. モンテネグロ、アルベルト トボン=カスターニョ、イヴァン D. ベレス

感染症学会サバメンジーズ保健大学院臨床研究ユニット、コタキナバル、サバ州、マレーシア

マシュー・J・グリッグ、ブリジット・バーバー、ティモシー・ウィリアム

マレーシア、サバ州、クイーンエリザベス病院臨床研究センター

ティモシー・ウィリアム

アディスアベバ大学自然科学部、アディスアベバ、エチオピア

シサイ・ゲタシュー & ベイエン・ペトロス

アルマウアー・ハンセン研究所

シサイ・ゲタチュー & エイブラハム・アセファ

エチオピア公衆衛生研究所、アディスアベバ、エチオピア

アシェナフィ・アセファ

マヒドン・オックスフォード熱帯医学研究ユニット、マヒドン大学、バンコク、タイ

アワブ・G・ラヒム、シンディ・S・チュー、オリヴォ・ミオット、ニコラス・J・ホワイト、リック・N・プライス、サラ・オーバーン

アフガニスタン、ジャララバード高等教育省ナンガルハル大学ナンガルハル医学部

アワブ・G・ラヒム

オックスフォード大学臨床研究ユニット、熱帯病病院、ホーチミン市、ベトナム

グエン・H・チャウ&トラン・T・ヒエン

国際下痢症研究センター感染症部門、ダッカ、バングラデシュ

モハマド・S・アラム&ワシフ・A・カーン

王立疾病管理センター、保健省公衆衛生局、ティンプー、ブータン

ソナム・ワンチャック

ホルモズガン医科大学感染症・熱帯病研究センター(イラン、ホルモズガーン州、バンダル・アッバス)

ヤグフーブ・ハミディ

ハルツーム大学医学部、ハルツーム、スーダン

イシャグ・アダム

国家衛生健康委員会寄生虫病制御予防重点研究所、江蘇省寄生虫およびベクター制御技術重点研究所、江蘇寄生虫病研究所、無錫、中国

ヤオバオ・リウ&チー・ガオ

南京医科大学公衆衛生学部(中国、南京)

劉耀宝

タイ・メーソートのマヒドン大学熱帯医学学部ショクロ・マラリア研究ユニット

カンラヤ・スリプラワット、シンディ・S・チュー、フランソワ・ノステン

サンパウロ大学生物医科学研究所寄生虫学教室(ブラジル、サンパウロ)

マルセロ・U・フェレイラ

NOVA リスボン大学衛生熱帯医学研究所、国際保健および熱帯医学、ポルトガル、リスボン

マルセロ・U・フェレイラ

パプアニューギニア医学研究所、マダン、パプアニューギニア

モーゼス・レーマン

ディーキン大学、ビクトリア州、オーストラリア

アリッサ・バリー

ウォルター・アンド・イライザ・ホール医学研究所、人口健康免疫部門、ビクトリア州、オーストラリア

アリッサ・バリー & アイヴォ・ミュラー

メルボルン大学医学生物学部、ビクトリア州、オーストラリア

アリッサ・バリー

寄生虫および昆虫ベクター部門、パスツール研究所、パリ、フランス

イボ・ミュラー

熱帯医学財団、マナウス、ブラジル

マーカス VG ラセルダ

オズワルド・クルス財団、マンギーニョス、リオデジャネイロ、ブラジル

マーカス VG ラセルダ

カエタノ・エレディア・ペルー大学、リマ、ペルー

アレハンドロ・リャノス=クエンタス

マヒドン大学、バンコク、タイ

シュリヴィチャ・クルドソード

国軍医科学研究所、バンコク、タイ

チャンタップ・ロン

ゴンダル大学、ゴンダル、エチオピア

レジカ・モハメッド

ジマ大学、ジマ、エチオピア

ダニエル・イルマ

熱帯医学研究センター、ポルトベーリョ、ブラジル

デリオ・B・ペレイラ

熱帯医学研究所、マニラ、フィリピン

フェイス EJ ホーソーン

ウンパン病院、ターク、タイ

チャヤドル・ナマイク・ラープ

臨床研究センター、カリ、コロンビア

マリア・F・ビジェガス

グラクソ・スミスクライン、ブレントフォード、英国

ジャスティン・A・グリーン & ギャビン・コー

ケンブリッジ医学研究所、ケンブリッジ大学臨床医学科、ケンブリッジ、英国

ジュリアン・C・ライナー

オックスフォード大学ナフィールド医学部、熱帯医学および国際保健センター、オックスフォード、英国

ニコラス・J・ホワイト、フランソワ・ノステン、リック・N・プライス、サラ・オーバーン

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

SA、HT、RA、RDP、RNP がこの研究を考案、設計し、原稿の初稿を書きました。 SA、HT、RA、RDP、ES がデータ分析を実施しました。 RN、LT、JM、ZP、DEF、TML-M.、LMM、AT-C.、MJG、BB、TW、NMA、SG、BP、A.アセファ、A.アセファ、AGR、NHC、TTT、MSA、 WAK、BL、KT、SW、YH、IA、YL、QG、KS、MUF、ML、AB、IM、MVGL、AL-C.、SK、CL、RM、DY、DBP、FEJE、CSC、IDV、CN -L.、MFV、JAG、GK、NJW、および FN は、重要なフィールドベースのマラリア コレクションとメタデータに貢献しました。 DPK、JCR、RA、RDP、ED、SG、VS、OM、AM がシーケンス、データ作成、情報サポートに貢献しました。

サラ・オーバーンへの手紙。

著者らは競合する利害関係を宣言していません。

Communications Biology は、この研究の査読に貢献してくれた Alfred Amambua-Ngwa と他の匿名の査読者に感謝します。 主な取り扱い編集者: Luke R. Grinham。 査読者レポートが利用可能です。

発行者注記 Springer Nature は、発行された地図および所属機関の管轄権の主張に関して中立を保っています。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

トリマルサント、H.、アマト、R.、ピアソン、RD 他。 輸入された三日熱マラリア原虫を識別するための分子バーコードおよび Web ベースのデータ分析ツール。 Commun Biol 5、1411 (2022)。 https://doi.org/10.1038/s42003-022-04352-2

引用をダウンロード

受信日: 2021 年 12 月 1 日

受理日: 2022 年 12 月 8 日

公開日: 2022 年 12 月 23 日

DOI: https://doi.org/10.1038/s42003-022-04352-2

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。