製品情報・受託サービス情報
What's New! 製品・サービス情報 ダウンロード e-mail_news登録   
会社情報
概要 ミッション アクセス リクルート 連絡先 ビジネスパートナー ライセンス 個人情報保護方針
Home製品・サービス情報バイオインフォマティクス・ソフトウェアCLC Bioinformatics Solution>CLC Genomics Workbench

製品・サービス情報
  
受託サービス
サービス別ラインナップ
  
科学機器
製品別ラインナップ
メーカー別ラインナップ
  
試薬・材料・消耗品
製品別ラインナップ
メーカー別ラインナップ
  
バイオインフォマティクス
ソフトウェア
製品別ラインナップ
メーカー別ラインナップ
- CLC bio
CLC bio Bioinformatics Solution
CLC bio Next Generation Sequencing Solution
FAQ
Desktop Software
CLC Genomics Workbench
-Latest Improvements
Biomedical Genomics Workbench
CLC Main Workbench
CLC Sequence Viewer
High Performance Computing
CLC Assembly Cell
Enterprise Solutions
CLC Genomics Server
CLC Genomics Machine
CLC Genomics Factory
CLC Bioinformatics Database
Plug-in
CLC MLST Module
CLC Genome Finishing Module
Blast2GO PRO
CLC Microbial Genomics Module
MetaGeneMark
プラグイン一覧

CLC Genomics Workbench Latest Improvements
 

CLC Genomics Workbench 11.0.0 (リリース日:2017年11月21日)


【改良および新しい機能】

Trim Re か Trimads
Tooloboxで、NGS Core Tools の Trim Sequence tool が、Trim Reads という名前に変わりました。
Trim Reads tool に、"Automatic read-through adapter trimming"という新しいオプションが追加されました。このオプションは、自動的に paired reads における ovaerlap を見つけ出し、その overlap した部分以外の領域を trim します。このオプションは、デフォルトで使用される様になっています。この新しいデフォルトは、Trim Reads(これまでの名前は、Trim Sequences)を含む workflow に影響します。これらの workflow では、このパラメーターは、デフォルトでアクティブになっていて、ロックされています。
Trimming adaptor
Trim Adapter List dialog が新しくなり、より使いやすいインターフェースになりました。
Sequence field の右にある"Reverse Completement"ボタンで、adaptor sequence を reverse complement することが可能になりました。
Trim をすべての reads で実行するのか、または、pair の最初または2番目の reads についてのみ実行するのかを指定することができる様になりました。
アダプターが見つかった場合の処理の optionを選択する画面において、アダプターおよびトリムされる配列と残りの配列の位置関係が図示される様になりました。
Fastq Export
Paired sequence list が2つの fastq フォーマットのファイルとしてエクスポートできる様になりました。一つは、各々の pair の最初の配列を、もう1つは2番目の配列を含んだファイルです。Paired data をエクスポートする際には、この方法がデフォルトになりました。
"Output as single file" がデフォルトでは無効になっています。
"Export paired sequence lists to two files" が新しいデフォルトの設定として導入されたことにより、新しいリリースにアップデートすると、fastq のエクスポートのステップを含む既存の workflow にコンフリクトが生じます。これは、この新しいデフォルトの option が以前のバージョンでデフォルトであった"Out as single file" のoption と異なるためです。影響を受ける workflow では、"Export paired sequence lists to two files" または、"Output as single file" のオプションのどちらかを除く必要があります。影響を受ける workflow をアップグレードする際に、この内容のメッセージが表示されます。
RNA-Seq Analysis
RNA-Seq Analysis tool を"Genome annotated with genes only"または、"One reference sequence per transcript" の option で実行した場合に、RPKMが必ず計算される様になりました。
Reference の種類のパラメーターのデフォルトが、"Genome annotated with genes and transcripts"になりました。
RNA-Seq Analysis tool において、option の "Calculate RPKM for genes without transcripts"が、"Calculate expression for genes without transcripts"という名前になりました。
"Genome annotated with genes and transcripts"が、"Calculate expression for genes without transcripts" のoption と一緒に使用された場合の RNA-Seq Analysis tool の動作の仕方を変更しました。
Transcript のアノテーションがない遺伝子のカウントが計算されます。以前は、TPM と RPKM のみが計算されていました。
対応する transcript のアノテーションが存在せず、他の遺伝子のイントロンと overlap している遺伝子に対しては、この領域にマップされた reads は、transcript のアノテーションがない遺伝子の発現としてカウントされます。以前は、この様な reads は、overlap する遺伝子のイントロン領域としてカウントされていました。
Transcript のアノテーションを持たない遺伝子に対する single-exon transcript が、結果の TE track に追加される様になりました。
ライセンスのない Workbench は、Viewing Mode で実行できる様になりました。このモードでは、データの閲覧、インポートおよびエクスポートが可能です。データを見るために必要な plug-in をインストールすることができます。Viewing mode は、これまでの Limited mode に機能が追加されたものです。
実行する前にアップデートが必要な workflow がインストールされている場合、Workbench を立ち上げた際にダイヤログが表示される様になりました。Workflow をアップデートする必要がある場合に必要な操作の情報が改善されました。
Data element の history を CSV フォーマットのファイルとしてエクスポートできる様になりました。
Extract Consensus Sequence tool は、workflow において、塩基データをインプットするより多くのツールと接続できる様になりました。これらのツールには、Map Reads to Reference や Map Reads to Contigs などのツールが含まれます。
Identify Known Mutations from Sample Mappings tool に、部分的に overlap する reads を含むという option が追加されました。この結果、read より長い変異を検出することができる様になりました。
Identify Known Mutations from Sample Mappings tool が Insertion や replacement を扱う際に少し厳密になりました。変異と完全にカバーしているとしてカウントされるためには、read が隣接する reference の position と overlap していることが必要です。
Illumina High-Throughput Sequencing Import のスピードが大きく改善されました。最も改善が見られたのは、gzip で圧縮された paired read file で、最高で30%のスピード向上が得られました。
アミノ酸の色を様々な種類の色盲のユーザーにとってより適した色に変更しました。
Download Pfam Database tool は、version31 をダウンロードする様になりました。アップデートは、CLC Genomics Workbench のリリースと関係なく行われる様になりました。したがって、ダウンロード可能なバージョンは、時間がたつとここに記述されたバージョンと変わる可能性があります。
Table view において、値が数字の場合に、"Is in list"および"Is not in list"でカラムをフィルターすることができる様になりました。
SAM または、BAM フォーマットのファイルをエクスポートする際に、オプションのフィールドである NM(edit distance)および MD(mismatch string)にも情報が入る様になりました。
Identify Candidata Variants tool のフィルターの記号として、'>=', '<=', 'abs value >=' および 'abs value <=' が使える様になりました。
Standard Import tool で "Generic annotation file for expression data"のファオーマットを指定して GO annotation file をインポートする場合に、GO annotation のいずれかが truncate されていた場合に警告とともにインポートが中断されます。
Create Expression Browser tool で作成されたデータを開く際に、truncated GO annotations が見つかった場合に警告が報告される様になりました。
'Expression Browser Table' (Create Expression Browser tool から出力されるテーブル)は、もしソートが grouped column に対して行われたものでなければ、grouping を変更する際にソートを保存する様になりました。
NCBI blast が、version2.6.0 にアップグレードされました。
ツールや workflow を実行する際に、wizard の sidebar に wizard のすべてのステップが表示される様になりました。
circular sequences の origin の両側にわたる様な feature の表示方法が、sequence と track について改良されました。
Tabel のフィルターと検索において、1000および小数点の記号は、tableでの表示と同じ様に解釈される様になりました。以前は、US punctuation (米国式の句読点の使い方)が必ず使用されました。今回の変更は、もし table で数字を"123.456,7"という形式で表示していたならば、10より小さい数字を"<10.0"または、"<10"で検索できるけど、"<10,0"では検索できません。
右クリックして表示される context menu でツールが選択できなくなっている場合に、多くの場合で、ツールの名前のところにマウスを持っていくとそのツールを使えない理由が表示されます。
Escape key で help window を閉じられる様になりました。
Download Reference Genome Data tool はこれまでの GTF ファイルではなく、GFF3ファイルからゲノムアノテーションをダウンロードする様になりました。ヒトゲノム hg18 および hg19 では、GFF3 ファイルがないので、これまで通り GTF ファイルとしてダウンロードします。
データを xlsx または、xls フォーマットでエクスポートする際に、HTML formatting tag が除かれる様になりました。この変更は、ハイパーリンクのエクスポートには影響しません。
Identify Candidate Variants tool の結果のファイルの history に、match criteria の field が追加されました。'match all' と 'match any' のどちらの option が用いられたかが記述されます。
Reads track において、side panel の option の"Highlight reverse paired reads"がデフォルトで選択できる様になりました。
Trim Sequence tool を Toolbox から実行した場合でも、workflow から実行した場合でも、パラメータが同じ順番で表示される様になりました。
Create Detailed Mapping Report tool の option で作成されるテーブルにおいて、各マッピングの統計値を含むカラムの見出しがより詳細な記述になりました。
Search for Reads in SRA tool において、表示されている行数が左上に表示される様になりました。
Search for Reads in SRA tool を実行している時の NCBI からのエラーメッセージに関する問題を改善しました。
Input に read が含まれない場合でも、Map Reads to Reference は、空の read mapping およびレポートを出力する様になりました。
Extract Sequences ツールを実行する際に、"Extract to single sequences option"が選択され、100以上の配列が結果として出力される場合に、警告のメッセージが表示される様になりました。

【変更点】
Roche454 および SILiD のImport tools が、Workbench Toolbox の Legacy folder に移動されました。将来のリリースでこれらのツールは廃止される予定です。
Trim Reads tool(以前のTrim Sequences)および Extract and Count tool において、"Search on both strands"のオプションがなくなりました。
Search for Sequences at NCBI tool は、GI number ではなく、accession version identifiers を用いる様になりました。これは、NCBIが GI number を漸次廃止するためです。
https://ncbiinsights.ncbi.nlm.nih.gov/2016/07/15/ncbi-is-phasing-out-sequence-gis-heres-what-you-need-to-know/ をご覧ください。)
Create Mapping Graph tool が改善され、overlap する paired end reads が、overlap する領域において、これまでの2つではなく1つとカウントされる様になりました。
Read Mapping Track をインプットとして用いた場合に、Detailed Mapping Report から、"Total consensus length"の行を除きました。Trackには、Consensus の情報が含まれないからです。
両方がペアの最初と記述されている、または、両方がペアの2番目と記述されている2つ以上の primary alignment がある read が存在する場合、SAM and BAM Mapping Files importer はエラーとなります。
テーブルをスクロールすると、決まった数の行や列ではなく、決まった数のピクセルをスクロールする様になりました。
Extact Consensus Sequence tool で、protein BLAST の結果を使うことができなくなりました。
Workbench Preferences の "Adapter trimming" のsection がなくなりました。この section は、すでになくなった機能の設定に関係していました。
Pop-up ダイヤログの "Help" および "Reset" ボタンは、テキストラベルのあるボタンになりました。
GCG sequence exporter がなくなりました。GCG alignment exporter は、使用可能です。

【バグの修正】
Create Statistics for Target Region tool で、"GC%" が ratio で報告されていた問題を改善して、percentage で報告する様にしました。
adapter read-through がある場合に、Forward-Reverse の向きの paired reads の paired distance が誤って計算されるという問題を解消しました。Paired distances は、Map Reads to Reference tool 及び RNA-Seq Analysis tool のレポートで見ることができます。paired distance の計算は、これらのツールの "auto-detect paired distances" の option によっても用いられます。しかし、この問題は推定された distance には影響しないと考えられます。
CDS アノテーションがorigin をまたいでいる circular sequence で、Amino Acid Changes tool を使用した場合に生じていた問題を解消しました。以前は、この様な、アノテーションの外側の変異に対して、coding region changes として間違えたアノテーションが付けられることがありました。
イントロンが origin をまたいでいる circular sequence で Amino Acid Changes tool を使用した場合に生じていた問題を解消しました。以前は、Coding region changes に近接する変異のアノテーションが付けられませんでした。今回の改善によって、この様なイントロンにおける変異で exon との距離が2塩基以内のものについて、coding region changes にアノテーションが付けられる様になりました。
Amino Acid Changes tool が、Coding region の変化をアノテーション付けする場合に、場合によって RNA reference ではなく CDS reference を使用するという問題を解消いたしました。この問題は、RNA と CDS のアノテーションが異なる場合に起こる可能性があり、UTR領域の変異を報告しない場合がありました。CDS と RNA のreference をペアにする場合に、GFF3 ファイルフォーマットの 'parent field' をサポートすることにより、matching の改善を行いました。
RNA-Seq Analysis tool を "Genes and transcripts" mode で、"Total counts"を Expression value として実行した場合に、GE track でレポートされる expression value に、共有されるexon のカウントが含まれないという問題を解消しました。Set Up Experiment tool に基づいて行われる下流の解析は、この問題に影響を受けます。影響を受けた GE-Track を次のツールのインプットとして用いる場合には、影響はありません。
Differential Expression for RNA-Seq, Create Heat Map for RNA-Seq, PCA for RNA-Seq
Differential Expression for RNA-Seq tool をバッチモードで実行する際に生じていた問題を解消いたしました。
Create Heat Map for RNA-Seq tool に無効なパラメータを入れた場合にエラーが起きていたのを解消しました。
Map Reads to References 及び Map Reads to Contigs tool の input sample の数に120以下という明示されていない制限があった問題を改善しました。120より多くのサンプルを用いた場合、警告のメッセージが表示されて実行が中止されます。解析は、120以下のサンプルで実行することが必要です。
Map Reads to References, Map Reads to Contigs 及び RNA-Seq-Analysis などで用いられている Workbench の mapping ツールにおいて、read の長さが500bpを超える場合に、length fraction および similarity fraction の cut-off 値が無視される場合があるという問題を解消しました。
InDels and Structural Variants においてある種のdeletion を持つ read を用いた場合にエラーが起きる問題を解消しました。
InDels and Structural Variants において、解析に broken pairs としてマップされている reads が含まれている場合に、重複した breakpoints および変異が報告されるという問題を解決しました。
実行中のジョブのログをフィルターすると、エラーダイアログが表示された問題を解消しました。
Workflow において、"Output as single file"というエクスポートのオプションの設定をできなかった問題を解消しました。
前に同じ名前と場所を指定してエクスポートを行った場合に、gzip または zip で圧縮したデータに、gz または zip の拡張子がつかないという問題を解消しました。
同義語(例えば"N"に対する"X")を含む様なリードを BAM フォーマットでエクスポートできる様になりました。
一つまたは複数の reference sequence に read がマップされていない場合、read mapping をエクスポートする場合に fasta exporter にエラーが起きる問題を解消しました。
折れ線グラフを含むレポートをエクスポートする際に生じていた問題を解消しました。
Identify Candidate Variants tool の設定画面において、デフォルトのパラメータへのリセットができないという問題を解消しました。
Trim Sequences tool において、ある長さのフィルター設定を行うと実行できないという問題を解消しました。
adapter read-through で起きる様に、reads が完全にオーバーラップしている場合に、reads track のside panel において"Highlight reverse paired reads"を選択した際に paired end reads が正しくない色で表示されるという問題を解消しました。
複数のハイパーリンクのURLを含む様なセルを、Excel2010またはExcel97-2007フォーマットでエクスポートする際にエラーが出る問題を解消しました。この様なセルの内容は、plain text で記述される様になりました。
10bp以上の領域をカバーする Gap annotation を含む contig を AGPフォーマットでエクスポートできる様になりました。エクスポートの際にこの様な gap を含む配列は、別々の contig に分けられます。CLC Genome Finishing Module の Join Contigs を使用しているユーザーは、この問題に関心があるでしょう。
Low Frequency Variant Detection tool において、少数のデータを用いた場合に稀に、Probability value が NaN になるという問題を解消しました。
いくつかのツールにおいて、多くの染色体を持つゲノムを扱う場合の performance を改善しました。
Annotate with Overlap Information, BED Exporter, Filter Annotations On Name, および Motif Search などのツールが含まれます。

【プラグインのお知らせ】
Workbench に module をインストールしたり、commercial modules のツールにより作成されたデータを見る際に、commercial modules のライセンスが必要なくなりました。
network module license のflexibility が改良されました。CLC License Server により与えられる workbench module licenses は、その module の tool が実行された場合にはじめて最初のロードが行われます。ロードされたライセンスは、その workbench で最後の tool が実行されてから4時間経過すると戻されます。

【その他のお知らせ】
Roche-454 および SOLiD に対する NGS import tool は、将来のリリースで廃止される予定です。




CLC Genomics Workbench 10.0
 (リリース日:2017年3月2日)


【RNA-Seq新ツール】
Create Combined RNA-Seq Report - RNA-Seq解析ツールにより作成された複数レポートを一つのレポートにまとめる機能が追加されました。
PCA for RNA-Seq* - サンプルを2Dまたは3Dでクラスタリングします。各サンプルに関する既知のメタデータは、オーバーレイとして追加されます。
Differential Ecpression for RNA-Seq* - negative binomial GLMに基づいた多因子統計を使用して発現比較を行います。
Creat Heat Map for RNA-Seq* - サンプルと特徴量を同時にクラスタリングします。各サンプルに関する既知のメタデータはオーバーレイとして追加されます。
Create Expression Browser* - 発現値、統計解析の結果、および遺伝子アノテーションを一緒に表示します。
Create Venn Diagram for RNA-Seq* - 異なる実験条件間で共通して発現差があった遺伝子を表示します。
Gene Set Test - hypergeometric test を用いて、Differential Expression for RNA-Seq tool の結果に含まれる遺伝子が多く含まれるgene sets(Gene Ontologyの用語など)を抽出します。
Import | RNA Spike-ins - RNA spike-in の配列と濃度のデータをインポートする機能が追加されました。
* アスタリスクが付いたツールは、以前のバージョンのWorkbenchではAdvanced RNA-Seq pluginから使用できたものです。これらのツールは、新しいバージョンでは、ToolboxのRNA-Seq Analysisフォルダーの中にあります。これらのツールでは、Sequencing depthによる差異を自動的に計算の際に考慮するので、入力データのノーマライズをする必要がありません。これらのツールは、既存のRNA-Seq TEまたはGE tracksで機能します。このリリースでの変更により、Differential Expression for RNA-Seq toolの出力が、Extract Annotations または、Extract Reads Based on Overlap ツールのインプットとして使える様になりました。

・RNA-Seq
RNA-Seq Analysisツールは、quality controlのために ERCCやSIRVなどのRNA Spike-insをサポートする様になりました。この変更により、既知のspike-inした濃度と測定されたtranscriptの濃度を比較することにより、RNA-Seq実験を評価することが可能となりました。Spike-inは、RNA Spike-ins Inportツールを用いてインポートすることができます。
RNA-Seq Analysis report を改良アップデートしました。
・Readsがマップされた領域のbiotype(protein coding, rRNA, pseudogeneなど)の分布を表示する様になりました。
・マップされたreadsのstrand specificityをレポートする様にしました。
・Transcript coverage plotsにより、5'および3'のcoverageのbiasを検出して表示することが可能になりました。
・ペアエンドのreadsに対して、adapter read-throughの可能性があるものを検出して警告する様にしました。
Biotypeの情報が利用できる場合、RNA-Seq Analysisツールにより作成されるExpression Track tablesの中のbiotypeのカラムで情報を見ることができる様になりました。
RNA-Seq AnalysisツールのMapping optionsから“Map to gene regions only”および“Also map to inter-genic regions”が除かれました。RNA-Seq Analysis toolは、与えられたreference全体にreadsをマップすることにより実行されます。以前のバージョンで推奨された“Also map to inter-genic reegions”optionを選択した場合と同じ結果になります。
RNA-Seq Analysisツールにおいて発現量をカウントする際に、常に“Expression level”optionで“Use EM estimation(recommended)”を使用する様にしました。このオプションは、以前のデフォルトオプションよりも正確です。このオプションによる違いは、Transcript Expression(TE) tracksにおいて、より大きくなります。
EM estimationによるRNA-Seq解析の定量がより速くなりました。
RNA-Seq解析において、ゲノムにuniqueにマップされたreadsは常にuniqueと分類される様になりました。以前は、uniqueにマップされたreadsであっても、複数の遺伝子がオーバーラップする位置にマップされた場合にambiguousであると分類されました。
RNA-Seq Analysisツールで作成されたtranscript expression(TE) tracksのENSEMBL columnにExon IDsが含まれなくなりました。遺伝子とtranscriptの名前は引き続き表示され、ハイパーリンクが表示されます。

・Import/Export
PacBio dataをインポートするツールができました。Import | PacBio から利用することができます。
Import Metadataツールを用いたデータの関連付けがより使いやすくなりました。変更点としては、特定のメタデータの列に関連するデータのプレビューの追加などが含まれます。
Import | Tracks ツールを最初に実行した時に、デフォルトのフォーマットとしてFastaが表示される様になりました。(これまでは、GFF2/GTF/GVFがデフォルトで表示されました。)
GFF形式のファイルをインポートする際に、GFF2/GTF/GVF tracksのimporterを利用することができなくなりました。GFF3形式のファイルをインポートする場合には、新しくできたGFF3 tracks importerを使用します。
CDSの扱いに関連してGFF3 importerをアップデートしました。これまでのバージョンでは、インポートの際に、異なるIDを持つが同じparent geneを持つCDSsは必ず同じCDS featureにまとめられました。今回の変更においても、GFF3ファイルの中の全てのCDSsがuniqueなIDを持つ場合や、IDを全く持たない場合には以前と同様な動作をします。同じIDが1つでも存在するGFF3ファイルについては、同じIDのCDSsのみが1つのfeatureとしてまとめられます。
GFF3 importerの詳細につきましては、以下のサイトをご参照ください。
http://resources.qiagenbioinformatics.com/manuals/biomedicalgenomicsworkbench/current/index.php?manual=GFF3_format.html
Import | Tracks ツールでfnaという拡張子のファイルをインポートできる様になりました。
Import | Tracks ツールを使用する際の“types of files to import”の表示が改良されました。
オリジナルファイルが多くの染色体に関連するデータを含むtrackをインポートする際のスピードが大幅に向上しました。
GFF3形式のファイルからインポートされるRNA trackはbiotypeにより色分けされる様になりました。
Import | Tracks ツールのCOSMIC optionが、インポートされるファイルの中のcolumn headingsという点においてよりflexibleになりました。
sequenceまたはtrackの上のアノテーションをGeneric Feature Format Version3(GFF3)形式で出力するためのexporterが追加されました。
BAM形式でexportする際に、index fileを作成するオプションができました。

・BLAST
BLAST at NCBIツールで使用するBLAST databaseのリストがアップデートされました。
“RefSeq representative genomes”databaseを追加しました。
“New or revised GenBank sequences(month)”を除きました。このデータは、もはやNCBIによってサポートされていません。
“References mRNA sequences”の名前を“References RNA sequences”に変更しました。検索されるdatabaseは以前と同じです。
“16S ribosomal RNA sequences”databaseがNCBI websiteにリストアップされた“rRNA typestrains/prokaryotic_16S_ribosomal_RNA”databaseを検索する様に変更しました。以前は、“TL/16S_ribosomal_RNA_Bacteria_and_Archaea”を検索していました。
“Human genomic plus transcripts”および“Mouse genomic plus transcripts”データベースの設定を新しいlocationを反映する様に修正しました。これらのデータベースを以前の情報で検索するとエラーになります。

【新しい機能と改良点】
Toolboxの配置を変更しました。expression analysisツールは、一番上のレベルのフォルダー“RNA-Seq Analysis”および“Microarray and Small RNA Analysis”に配置しました。以前の一番上のレベルのフォルダーTranscriptomics Analysisは除きました。
Gene Ontologyの用語を参照するGene Setsを使用する際、遺伝子アノテーションが自動的にparent Gene Ontologyの用語に継承されます。この改良は、Hypergeometric Tests on Annotations および Gene Set Enrichment Analysis(GSEA)に影響します。
マッピングのステップを含む Map Reads to References, Map Reads to Contigs および RNA-Seq Analysisなどのツールで使用されるWorkbenchのmappingツールをアップデートしました。アップデートには、マッピングの質、スピード(特に長いリード)、index作成時のメモリのパフォーマンス、および様々なバグの修正が含まれます。新しいmappingツールは、2017年3月にリリース予定のAssambly Cell 5.0.3に搭載されるclc-mapperツールと同じです。
Local Realignmentツールの“Maximum guidance-variant length”パラメーターのデフォルト値を100から200に変更しました。この変更は、すべてのready-to-use workflowsおよび直接実行した際に適用されます。
Basic Variant Detectionツールは、変異のポジションにambiguous baseが存在する場合に、Nをalternative alleleとしてレポートしない様にしました。
Create Statistics for Target Regionsにより作成されるレポートで、“>”ではなくて“≧”の記号を用いる様にしました。
Create Sequencing QC Reportツールの“Additional Reporting”オプションの中の“Quality analysis”および“Over-representation analysis”を除きました。これらのオプションはデフォルトで作成される様になりました。
Search for Reads in SRAツールにPubmed search optionを追加しました。この検索は、PubMed abstractまたはfull-text articleに関連した結果を返します。
Motif Searchツールを使用する際に、Java regular expressionsを使用する場合に、“Negative lookahead(否定先読み)”をサポートする様になりました。
新しい、または、すでに存在するsequence listsにおいて、Element Info viewのRead Group settingからsequencing platformを指定することができる様になりました。
Tableのセルを右クリックして、そのセルの値に基づいてtableの列をフィルターすることができる様になりました。その際に、新しく作成された“Table filters”というメニューからオプションを選択します。この変更は、advanced filteringが利用できる全てのtableに適用されます。
trackをソートおよびloadingするスピードが大幅に向上しました。これらの変更により、これ以後のバージョンのWorkbenchで作成されたtrackは以前のバージョンのWorkbenchで使用できなくなります。古いバージョンのWorkbenchで作成されたtrackは引き続き使用することができます。
Metadata Tableで指定したメタデータに関連するdata elementsを検索するスピードが大幅に向上しました。CLC Genomics Workbench 10.0にアップグレードした後にメタデータに関連した検索を有効にするためには、関連するデータを含むlocationに対するインデックスを再構築する必要があります。
Find Broken Pair Matesツールで作成されたtableの中のposition情報を含むカラムは、アルファベット順ではなくて数字順にソートされる様になりました。これらのカラムのアルファベット順のソートは、CLC Genomics Workbench 9.0で導入されました。それ以前のバージョンでは、数字順にソートされました。
Wizardを開いているとき、Turorial windowがブロックされることがなくなりました。
その他、様々な小さな改良を行いました。

【バグ修正および変更】
Map Reads to ReferencesならびにMap Reads to Contigsツールのindex作成中に、最大のコア数が設定されているcpu.propertiesファイルのmaxcoresの設定が考慮されていませんでしたが、その問題が修正されました。
Map Reads to Referencesツールの出力時に、配列が環状であることがリポートされない問題が修正されました。
Create Detailed Mapping Reportツールが、環状配列のリード数を誤ってリポートするケースがありましたが、修正されました。
Basic Variant Detection, Low Frequency Variant Detection ならびに Fixed Ploidy Variant Detectionツールを使用する際、ヘテロな多型であるケースにも関わらず、フィルタリングの過程で挿入変異の一方が除かれてしまい、ホモな多型とリポートする問題が修正されました。
Identify Known Mutations from Sample Mappingsツールが、workflow中で使用され、インプットとして複数のマッピングデータが使われる際に起こるエラーが修正されました。
配列のAnnotation Tableでannotationを編集している時に、同時に表示されているannotation typeが変わってしまう問題を修正しました。この問題は、annotation変更時のエラーにつながる可能性がありました。
GenBankやEMBLの情報をエクスポートする際に、情報を間違えて設定した場合に起こる問題が修正されました。
Primer tableで、Save Primer(S) Fwd, RevまたはSave Fragmentのオプションを選択して実行している際に、Cancelをクリックして操作を中止した場合に起こる問題を修正しました。
空の値を入力してテーブルをフィルターした場合に、時折結果が表示されない問題を修正しました。
Advanced filteringで、“=”の記号を用いて複数の値を含むセルが存在する列に対して検索した際に、正常に実行されない問題を修正しました。
Exportのstepを含むワークフローが問題を発生しても、問題が起こったことを表示しない問題を修正しました。
“java.langClassCastException: sun.awt.image.BufImgSurfaceData cannot be cast to sun.java2d.xr.XRSurfaceData”というエラーメッセージが生じるJavaの問題が、Javaのアップデートにより解決されました。この問題は、主にLinuxシステム上のWorkbenchにリモートアクセスする場合に起こりました。
Schemeにblankがある場合に、MLST schemeから正しいsequence typeを同定できないという問題を修正しました。この問題は、CLC MLSTまたは、Microbial Genomics ModuleがインストールされているWorkbenchにのみ起こりました。
その他、様々なバグを修正しました。

【提供終了情報】
GFF exporter機能が終了し、使用できなくなりました。新しいGFF3 exporterをご使用ください。
Probabilistic Variant Detection(legacy)ならびにQuality-based Variant Detection(legacy)ツールの提供が終了し、ToolboxのLegacyフォルダーから削除されました。
Toolbox | Legacyの中の、Expression Profiling by Tagsフォルダーの中のツールのご提供を終了しました。終了したのは、Extract and Count Tags、Create Virtual Tag ListならびにAnnotate Tag Experimentです。

【Pluginに関するお知らせ】
Advanced RNA-Seq pluginのご提供が終了しました。このpluginに含まれていたツールは、ソフトウェア本体に統合されました。詳しくは、RNA-Seqセクション中の新機能をご確認ください。

【その他のお知らせ】
匿名の使用情報をキアゲンに提供しないオプションをWorkbench Preferenceに加えました。キアゲンは、現在のところどの様な使用に関する情報も集めていないために、本機能のオンオフでの影響はありません。




CLC Genomics Workbench 9.5
 (リリース日:2016年9月15日)


最新の追加機能と改善点

【新ツール】
”Search for Reads in SRA”により、SRAデータベースの検索・ダウンロードができる様になりました。
Download ボタンから使用可能です。
新しく”GFF3 importer”の機能ができました。Import->Track tool から使用可能です。
Read mapping の中の既知のゲノム変異を検索できる“Identify Known Mutations from Sample Mapping”を追加しました。Resequencing Analysis tool folder から使用できます。
特定の条件を満たした変異の同定・抽出が可能な“Identify Candidate Variants”を追加しました。Annotate and Filter Variants tool folder から使用可能です。
“RNA-Seq Analysis”tool に、“Use EM estimation(recommended)”がオプションとして新たに加わりました。このオプションを利用することで、expectation-maximization algorithm を用いてIsoform/genes 間で分配が難しいreadを分配することができます。

【改善点】

・Resequencing
100bp以上のガイダンス変異を使用できる新しいオプションが、Local Realignment tool に追加されました。
InDels and Structural Variants tool において、broken pair としてマップされた reads を解析に含めるオプションが追加されました。
InDels and Structural Variants tool に、相対カバレッジや quality score が低すぎる read を除外する consensus calculation のオプションを追加しました。
COSMIC importer がアップデートされ、最新の COSMIC リリースv77を取り込むことができます。
multi-core のシステムで実行する場合において、以下のツールのパフォーマンスが改善されました。
Annotate from Known Variants, Filter against Known Variants, Filter against Control reads, Annotate with exon Numbers, Annotate with Franking Sequences, Filter Marginal Variants calls, Filter Reference Variants, Compare Sample Variants Tracks, Trio Analysis, GO enrichment Analysis, Amino Acid Changes, Annotate with Conservation Score, Predict Splice Site Effect, Link Variants to 3D Protein Structure, Merge Annotation Tracks, Create Statistics for Target Regions, Fisher Exact Test.

・RNA-Seq
“Filter Based On Overlap”と“Annotate with Overlap Information”において、Advanced RNA-Seq plugin で作られる Statistical Comparison Tracks を使用することができる様になりました。
Expression tracks を BED 形式で export 可能になりました。Expression value は、score として ecport されます。
Expression data を視覚的に解釈しやすい様に、Expression track がログスケールでカラー表示されます。
Expression track の track view が、ご使用のモニターサイズに合わせてダイナミックにスケールが変更されます。この変更により、Expression track が他のタイプの Track とつり合った大きさで表示される様になりました。

・Launch
Quick launch tool が、View menu から Toolbox menu からの利用に変更されます。本機能用の Launch ボタンが toolbar に加えられました。
Local Search の結果のテーブルに表示された data element から解析を行うことができます。解析したい element を選択し、右クリックして表示されたリストの中から目的の解析を選んで実行します。

・Workflow
Workflow のアウトプットを含むサブフォルダーを作成する様に設定できる様になりました。
Workflow の出力ファイル名を指定する際に、新しいプレースホルダーを使用することができる様になりました。{user}, {host} および出力される時間に基づくタイムスタンプ情報 {year}, {month}, {day}, {hour}, {minute}, {second} が利用可能となりました。
Workflow アウトプット名のプレースホルダーは、以前は数字のみを使用できましたが、今回、名前で指定することができる様になりました。{name} は、{1}, {input} は、{2} と同義になります。
Workflow アウトプットエレメントでカスタム名として {2} プレースメントホルダーを用いた場合、unlocked インプットのみが生成される名前に含まれます。
Workflowで設定されたすべてのパラメーター設定を示す pdf 上で、ツールまたはインプットエレメントに関連するパラメーターは、指定したエレメント名のリストで表示されます。以前は、その様なエレメントは、パラメーターリスト中にブランクのまま表示されていました。
Workflowで作成された data element のHistory view に、そのデータを作成した workflow の情報が含まれる様になりました。
Workflow で tool の名前を変更した場合に、Workflow パラメーターを export すると、元の名前が新しい名前と並んで表示されます。
Workflow の“Add Element”menu のツール表示の順序は、Workbench toolbox menu の順序と同じになりました。

・メタデータ
選択した data element から metadata association を除く“Remove Association(S)”オプションが、Metadata Element view に加えられました。右クリックの後、Context Menu からご使用ください。
Metadata Find Association Data View の中で、複数の列が選択されている場合、Find in Navigation Area を使うことが可能です。
spreadsheet から数式を含むメタデータを import する場合、数式自体ではなく、数式の計算結果(Excelに表示されている値)が import されます。
Workflow validation が改良され、Workflow elements の設定のため無視される input の確認が容易になりました。

・一般的改善点
NGS Core Tool の Trim Sequences tool で、adaptor や primer シークエンス中の不確定な塩基情報を扱える様になりました。
NGS Core Tool 中の Trim Sequence tool の discard reads above length オプションの上限が、8000から99,999に変更されました。
Identify Graph Thresholds tool が、regions の指定のみで使用できる様になりました。
Sample Reads tool の新オプションで、サンプリングを確定的に行う(いつも同じreadsを選択する)のかまたはランダムに行うのかを選択できます。
Sort folder tool で、数字をつけたファイル名を数字でソートすることが可能になりました。
exporter の出力ファイル名を指定する際に、新しいプレースホルダーを使用することができる様になりました。{user}, {host} および出力される時間に基づくタイムスタンプ情報 {year}, {month}, {day}, {hour}, {minute}, {second} が利用可能となりました。
export アウトプット名のプレースホルダーは、以前は数字のみが使用できましたが、今回、名前で指定することができる様になりました。{input} は、{1}, {extension} は、{2}, {counter} は、{3} と同義になります。
Identify Graph Thresholds tool が下限値または上限値の設定のみで使用できます。以前は、その両方を設定する必要がありました。
Extract Consensus Sequence tool は、すべての結果で sequence list を出力します。以前は、本ツールを単独で実行した場合、結果が1つの sequence であると、アウトプットはsequenceで、sequence list ではありませんでした。(workflowの一部として、本機能を使用する場合は、何も変更はありません。シークエンスリストが常に作成されます。)
Extract Consensus Sequence tool において、それぞれのcontigが処理された後のメッセージ表示をなくしました。
Download Reference Genome Data manager は、いくつかの genome annotation について version を表示します。
Workbench にあらかじめインストールされている酵素リストが、REBASEからアップデートされました。
Read group の詳細が、sequence list の Element info view 中に表示される様になりました。
Tree editor において、Unknown カテゴリーを隠すことができます。
Table の filtering のオプションとして、“is not in list”オプションが新たに加わりました。
全ての NCBI サーバーとの接続が、暗号化されました。(すべての NCBI の web service が、2016年9月30日より HTTPS プロトコルに移行されます。)
GenBank インポートで、ファイル名に GBFF 拡張子が、使用可能になりました。
Report 中の Standard deviations は、これまでと異なるアルゴリズムで計算される様になりました。この変更はほとんどの場合において、大きな影響はないと考えられます。
Track のtable view で“Create Track from Selection”ボタンをクリックすることで作成された variant, feature および expression track の History view に、新しい track を作成する際に table で実行された advanced filtering の詳細情報を含む様になりました。
”Download Reference Genome Data”tool でダウンロードした3'UTRおよび5'UTRのtrackには別々の接尾語が付く様になりました。以前は、trackの名前は、“utr”および“utr-1”で終わっていました。
gzipで圧縮された大きな illumina および Ion-Torrent ファイルの import の際の progress report を改善しました。
一般的なスピードおよび使い勝手を改良しました。

【変更点】

・ツールの廃止
“Expression Profiling by Tags”のフォルダーは、toolboxのLegacy Tools の section に移動しました。

・Bug fixes
“Extract from Selection”および“Extract Reads Based on Overlap”の両ツールにおける問題を解消して、1D表示された circular genome の末端を超えている mapped reads を正しく抽出する様にしました。
Motif Search tool において、match accuracies が0%または100%と表示されていた不具合を解消して、正しい値が表示される様にしました。
Report を Excel に export する際に配列名中の文字が間違えて表示されるという問題を解決いたしました。
Download Reference Genome Data manager は、最新バージョンの Ensembl GRCh38 Genome をダウンロードする設定になりました。以前は、Ensembl version 82 がダウンロードされる様になっていました。
Broken pair の read1 と read2 の両方を検索する場合に、“Find Broken Pair Mates”ツールが、read1 の mate として、read1 自身を報告するという不具合を解消しました。“Find Broken Pair Mates”は、read1 の mate を read2 であると正しく表示します。
複数の read groups が含まれる場合、broken pair table の中で、Create New Sequence List button が機能する様にしました。
無効なバーコードが入力された場合に、Demultiplex Reads tool のウィザードにエラーが出る不具合を解消しました。
レポートを export する際にいくつかのグラフの export で生じていた不具合を解消いたしました。
Read Mapping を Track list に加える際にまれに生じた不具合を解消いたしました。
“Find Binding Sites and Create Fragments”ツールは、primer input が小文字の場合でも正しくミスマッチを表示します。
Statistical comparison tracks を read mapping tracks と一緒に表示した場合に、statistical comparison track の annotations がゲノム上の正しい位置からずれて表示されるという不具合を解消しました。
Extract Consensus ツールにおけるメモリーリーク(バグの一種)を解消いたしました。
長さゼロの配列が含まれる場合、Create BLAST Database tool にエラーが起きる問題を解消しました。この様な配列はスキップされ、最終的なデータベースに含まれません。
illumina High-Throughput Sequencing Import tool は、複数のエントリーを含む zip ファイルをサポートしていないと正しい warning を出す様になりました。
126 million 以上のエントリーの Table では何も表示されませんでしたが、今は、“contain too much data to display”という warning が表示されます。
Create Entry Clone tool の wizard において、以前に用いられたデータがマウントされていない location に存在する場合に、エラーメッセージが表示される不具合を解消しました。
Report の graph を右クリックして、Show->“Report”, “History”または“Element Info”を選択した際にエラーが起きた不具合を解消しました。
Sortされた table editor を表示した状態で workbench を閉じた場合に、次回、workbench を開くのに長い時間がかかるという問題を解消しました。
“Manage Enzymes”wizard で、“Save as new enzyme list”が有効になっている場合、cancel できないという不具合を解消しました。
Deletion または右クリックで使用できる“Delete selection”が使用されていないのに、あるタイプの annotation が1000以上存在する sequence において、annotation が sequence の上に表示されないことがあるというまれな不具合が解消されました。
Table におけるPDB および dbEST データベースへのリンクの問題を解消しました。
Track list において、reads track の右クリックによる“Extract from selection”のオプションが機能しないというまれに起こる問題を解消しました。
特定の system local を持つ system で、Wiggle に exportする際、再インポートできないファイルを生成する不具合を解消しました。
Import Metadata tool において、ある spreadsheet をすでにロードした場合、同じ spreadsheet を再度選択しても spreadsheet の内容を再ロードしない不具合を解消しました。
複数の input をもつ workflowをバッチ処理で実行する際に、別の metadata spreadsheet が選択されたとき、workflow execution wizard が正しくアップデートされないという不具合を解消しました。
Processes tab を非表示から再表示させた場合、表示されていたプロセスが再表示されないという不具合を解消しました。
“Save in input folder”が直前に使われたオプションであるときに、save wizard dialog で“Save in input folder”があらかじめ選択されないという不具合を解消しました。
バージョン6.5またはそれ以前の CLC Genomics Workbench で作成された Create Sequencing QC Report を含む workflow を取り込んだ際に生じた問題を解消しました。
Blast editor の“Download and save”でエラーが出る不具合を解消しました。
UniProt databases へのリンクのURLをアップデートしました。
その他、様々な小さな不具合を解消しました。

【注意】
今後、64bit版の CLC Genomics Server, CLC Genomics Workbench, Biomedical Genomics Workbench, CLC Bioinformatics Database および CLC Assembly Cell のみがリリースされます。32bit版は廃止されます。

【事前告知】
Probabilistic Variant Detection(legacy) および Quality-based Variant Detection(lagacy) の両ツールは、Genomics Workbench および Genomics Server から2017年春に無くなる予定です。
Expression Profiling by Tags ツール(Extract and Count Tags, Create Cirtual Tag List, and Annotate Tag Experiment)は、Genomics Workbench および Genomics Server から2017年春に無くなる予定です。

お問い合わせ biosupport@filgen.jp P.052-624-4388 www.filgen.jp
Copyright (C) 2004-2018 Filgen, Inc. All Rights Reserved.