П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 19.09.2022 № 2 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина illumina (Yandex.Cloud) Рабочий диск vdb1 Папка назначения /mnt/vdb1/SRA/sra 1.2. Место назначения для загрузки адрес виртуальной машины динамический папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR15992415/SRR15992415 формат исходных данных .sra объем исходных данных 8.9 Гб 1.3. Проведение копирования Команда: prefetch  Параметры: time prefetch SRR15992415 Время выполнения: 0 минут 13.198 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRA/sra Выходные данные: SRR15992415.sra 8.9 Гб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 19.09.2022 № 8 ( ) не заполняется 2.1. Наименование виртуальной машины: srv_r940 2.2. Конфигурация машины: 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 19.09.2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 SRR15992415 Время выполнения: 2 минут 52.513 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415 Выходные данные: SRR15992415_1.fastq 30.3 Гб SRR15992415_2.fastq 30.3 Гб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR15992415_1.fastq Время выполнения: 2 минут 33.218 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415 Выходные данные: SRR15992415_1_fastqc.html 229 Кб SRR15992415_1_fastqc.zip 252 Кб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR15992415_2.fastq Время выполнения: 2 минут 37.452 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415 Выходные данные: SRR15992415_2_fastqc.html 222 Кб SRR15992415_2_fastqc.zip 243 Кб Команда: trimmomatic Параметры: time java -jar /soft/trimmomatic/Trimmomatic-0.39/trimmomatic-0.39.jar PE -threads 64 -phred33 SRR15992415_1.fastq SRR15992415_2.fastq SRR15992415_1_1P.fq.gz SRR15992415_1_1U.fq.gz SRR15992415_2_2P.fq.gz SRR15992415_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 Время выполнения: 32 минут 15.936 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415 Выходные данные: SRR15992415_1_1P.fq.gz 6.00 Гб SRR15992415_1_1U.fq.gz 150 Мб SRR15992415_2_2P.fq.gz 6.71 Гб SRR15992415_2_2U.fq.gz 3.84 Мб Команда: spades Параметры: time /soft/python/3.10.4/bin/python3 /soft/spades/SPAdes-3.15.4-Linux/bin/rnaspades.py -t 64 --pe-1 1 SRR15992415_1_1P.fq.gz --pe-2 1 SRR15992415_2_2P.fq.gz -o spadesSRR15992415 Время выполнения: 272 минут 11.935 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415/spadesSRR15992415 Выходные данные: transcripts.fasta 123 Мб Другие папки и файлы: pipeline_state tmp K73 K49 misc spades.log transcripts.paths transcripts.fasta soft_filtered_transcripts.fasta hard_filtered_transcripts.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg before_rr.fasta run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 1.84 Гб Команда: quast Параметры: time /soft/python/3.10.4/bin/python3 /soft/quast/quast-5.0.2/quast.py -t 64 -o QUAST --pe1 SRR15992415_1_1P.fq.gz --pe2 SRR15992415_2_2P.fq.gz /mnt/r840_storage/gentech/a.e.krokhina/SRR15992415/spadesSRR15992415/transcripts.fasta Время выполнения: 0 минут 39.238 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415/quast Выходные данные: report.pdf 43.3 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.55 Мб Команда: busco Параметры: time busco -i /mnt/r840_storage/gentech/a.e.krokhina/SRR15992415/spadesSRR15992415/transcripts.fasta -l /mnt/san01/a.e.krokhina/insecta_odb10/ -o busco -m transcriptome -f --offline -c 64 Время выполнения: 4 минут 40.207 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415/busco Выходные данные: full_table.tsv 449 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 73.5 Мб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 19.09.2022 № 3 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина srv_r940 Рабочий диск /mnt/r840_storage Папка назначения /mnt/r840_storage/gentech/a.e.krokhina/SRR15992420 1.2. Место назначения для загрузки адрес виртуальной машины 10.230.206.2 папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR15992420/SRR15992420 формат исходных данных .sra объем исходных данных 5.1 Гб 1.3. Проведение копирования Команда: prefetch  Параметры: time prefetch SRR15992420 Время выполнения: 7 минут 31.743 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina Выходные данные: SRR15992420.sra 5.1 Гб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 19.09.2022 № 6 ( ) не заполняется 2.1. Наименование виртуальной машины: srv_r940 2.2. Конфигурация машины: 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 19.09.2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 SRR15992420 Время выполнения: 9 минут 31.162 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR15992420 Выходные данные: SRR15992420_1.fastq 20.5 Гб SRR15992420_2.fastq 20.5 Гб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR15992420_1.fastq Время выполнения: 11 минут 43.772 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR15992420 Выходные данные: SRR15992420_1_fastqc.html 546 Кб SRR15992420_1_fastqc.zip 337 Кб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR15992420_2.fastq Время выполнения: 11 минут 34.762 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR15992420 Выходные данные: SRR15992420_2_fastqc.html 551 Кб SRR15992420_2_fastqc.zip 338 Кб Команда: trimmomatic Параметры: time java -jar /soft/trimmomatic/Trimmomatic-0.39/trimmomatic-0.39.jar PE -threads 64 -phred33 SRR15992420_1.fastq SRR15992420_2.fastq SRR15992420_1_1P.fq.gz SRR15992420_1_1U.fq.gz SRR15992420_2_2P.fq.gz SRR15992420_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 Время выполнения: 31 минут 11.639 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR15992420 Выходные данные: SRR15992420_1_1P.fq.gz 3.79 Гб SRR15992420_1_1U.fq.gz 34.4 Мб SRR15992420_2_2P.fq.gz 3.84 Гб SRR15992420_2_2U.fq.gz 1.46 Мб Команда: spades Параметры: time /soft/python/3.10.4/bin/python3 /soft/spades/SPAdes-3.15.4-Linux/bin/rnaspades.py -t 64 --pe-1 1 SRR15992420_1_1P.fq.gz --pe-2 1 SRR15992420_2_2P.fq.gz -o spadesSRR15992420 Время выполнения: 361 минут 29.154 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR15992420/spadesSRR15992420 Выходные данные: transcripts.fasta 78.6 Мб Другие папки и файлы: pipeline_state tmp K73 K49 misc spades.log transcripts.paths transcripts.fasta soft_filtered_transcripts.fasta hard_filtered_transcripts.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg before_rr.fasta run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 1.12 Гб Команда: quast Параметры: time /soft/python/3.10.4/bin/python3 /soft/quast/quast-5.0.2/quast.py -t 64 -o QUAST --pe1 SRR15992420_1_1P.fq.gz --pe2 SRR15992420_2_2P.fq.gz /mnt/r840_storage/gentech/a.e.krokhina/SRR15992420/spadesSRR15992420/transcripts.fasta Время выполнения: 0 минут 23.141 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR15992420/QUAST Выходные данные: report.pdf 39.0 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.52 Мб Команда: busco Параметры: time busco -i /mnt/r840_storage/gentech/a.e.krokhina/SRR15992420/spadesSRR15992420/transcripts.fasta -l /mnt/san01/a.e.krokhina/insecta_odb10/ -o busco -m transcriptome -f --offline -c 64 Время выполнения: 3 минут 19.869 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR15992420/busco Выходные данные: full_table.tsv 381 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 49.9 Мб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 19.09.2022 № 4 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина srv_r940 Объем свободного дискового пространства на рабочем диске /mnt/r840_storage Папка назначения /mnt/r840_storage/gentech/a.e.krokhina/SRR15992420 1.2. Место назначения для загрузки адрес виртуальной машины 10.230.206.2 папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR18138813/SRR18138813 формат исходных данных .sra объем исходных данных 2.0 Гб 1.3. Проведение копирования Команда: prefetch  Параметры: time prefetch SRR18138813 Время выполнения: 0 минут 50.685 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR15992420 Выходные данные: SRR18138813.sra 2.0 Гб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 19.09.2022 № 10 ( ) не заполняется 2.1. Наименование виртуальной машины: srv_r940 2.2. Конфигурация машины: 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 19.09.2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 SRR18138813 Время выполнения: 4 минут 6.175 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138813 Выходные данные: SRR18138813_1.fastq 7.72 Гб SRR18138813_2.fastq 7.72 Гб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR18138813_1.fastq Время выполнения: 2 минут 18.382 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138813 Выходные данные: SRR18138813_1_fastqc.html 232 Кб SRR18138813_1_fastqc.zip 256 Кб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR18138813_2.fastq Время выполнения: 2 минут 19.530 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138813 Выходные данные: SRR18138813_2_fastqc.html 230 Кб SRR18138813_2_fastqc.zip 252 Кб Команда: trimmomatic Параметры: time java -jar /soft/trimmomatic/Trimmomatic-0.39/trimmomatic-0.39.jar PE -threads 64 -phred33 SRR18138813_1.fastq SRR18138813_2.fastq SRR18138813_1_1P.fq.gz SRR18138813_1_1U.fq.gz SRR18138813_2_2P.fq.gz SRR18138813_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 Время выполнения: 15 минут 24.284 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138813 Выходные данные: SRR18138813_1_1P.fq.gz 1.46 Гб SRR18138813_1_1U.fq.gz 4.95 Мб SRR18138813_2_2P.fq.gz 1.48 Гб SRR18138813_2_2U.fq.gz 3.42 Мб Команда: spades Параметры: time /soft/python/3.10.4/bin/python3 /soft/spades/SPAdes-3.15.4-Linux/bin/rnaspades.py -t 64 --pe-1 1 SRR18138813_1_1P.fq.gz --pe-2 1 SRR18138813_2_2P.fq.gz -o spadesSRR18138813 Время выполнения: 167 минут 14.926 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138813/spadesSRR18138813 Выходные данные: transcripts.fasta 99.9 Мб Другие папки и файлы: pipeline_state tmp K73 K49 misc spades.log transcripts.paths transcripts.fasta soft_filtered_transcripts.fasta hard_filtered_transcripts.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg before_rr.fasta run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 1.54 Гб Команда: quast Параметры: time /soft/python/3.10.4/bin/python3 /soft/quast/quast-5.0.2/quast.py -t 64 -o QUAST --pe1 SRR18138813_1_1P.fq.gz --pe2 SRR18138813_2_2P.fq.gz /mnt/r840_storage/gentech/a.e.krokhina/SRR18138813/spadesSRR18138813/transcripts.fasta Время выполнения: 0 минут 13.574 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138813/quast Выходные данные: report.pdf 37.3 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.49 Мб Команда: busco Параметры: time busco -i /mnt/r840_storage/gentech/a.e.krokhina/SRR18138813/spadesSRR18138813/transcripts.fasta -l /mnt/san01/a.e.krokhina/insecta_odb10/ -o busco -m transcriptome -f --offline -c 64 Время выполнения: 5 минут 32.753 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138813/busco Выходные данные: full_table.tsv 92.3 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 481 Мб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 19.09.2022 № 5 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина srv_r940 Рабочий диск /mnt/r840_storage Папка назначения /mnt/r840_storage/gentech/a.e.krokhina/SRR18138815 1.2. Место назначения для загрузки адрес виртуальной машины 10.230.206.2 папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR18138815/SRR18138815 формат исходных данных .sra объем исходных данных 2.1 Гб 1.3. Проведение копирования Команда: prefetch  Параметры: time prefetch SRR18138815 Время выполнения: 1 минут 23.936 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138815 Выходные данные: SRR18138815.sra 2.1 Гб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 19.09.2022 № 9 ( ) не заполняется 2.1. Наименование виртуальной машины: srv_r940 2.2. Конфигурация машины: 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 19.09.2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 SRR18138815 Время выполнения: 2 минут 37.143 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138815 Выходные данные: SRR18138815_1.fastq 8.11 Гб SRR18138815_2.fastq 8.11 Гб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR18138815_1.fastq Время выполнения: 2 минут 34.004 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138815 Выходные данные: SRR18138815_1_fastqc.html 582 Кб SRR18138815_1_fastqc.zip 351 Кб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR18138815_2.fastq Время выполнения: 2 минут 31.573 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138815 Выходные данные: SRR18138815_2_fastqc.html 579 Кб SRR18138815_2_fastqc.zip 350 Кб Команда: trimmomatic Параметры: time java -jar /soft/trimmomatic/Trimmomatic-0.39/trimmomatic-0.39.jar PE -threads 64 -phred33 SRR18138815_1.fastq SRR18138815_2.fastq SRR18138815_1_1P.fq.gz SRR18138815_1_1U.fq.gz SRR18138815_2_2P.fq.gz SRR18138815_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 Время выполнения: 18 минут 14.492 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138815 Выходные данные: SRR18138815_1_1P.fq.gz 1.50 Гб SRR18138815_1_1U.fq.gz 5.86 Мб SRR18138815_2_2P.fq.gz 1.55 Гб SRR18138815_2_2U.fq.gz 3.52 Мб Команда: spades Параметры: time /soft/python/3.10.4/bin/python3 /soft/spades/SPAdes-3.15.4-Linux/bin/rnaspades.py -t 64 --pe-1 1 SRR18138815_1_1P.fq.gz --pe-2 1 SRR18138815_2_2P.fq.gz -o spadesSRR18138815 Время выполнения: 239 минут 49.135 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138815/rnaspadesSRR18138815 Выходные данные: transcripts.fasta 88.4 Мб Другие папки и файлы: pipeline_state tmp K73 K49 misc spades.log transcripts.paths transcripts.fasta soft_filtered_transcripts.fasta hard_filtered_transcripts.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg before_rr.fasta run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 1.36 Гб Команда: quast Параметры: time /soft/python/3.10.4/bin/python3 /soft/quast/quast-5.0.2/quast.py -t 64 -o QUAST --pe1 SRR18138815_1_1P.fq.gz --pe2 SRR18138815_2_2P.fq.gz /mnt/r840_storage/gentech/a.e.krokhina/SRR18138815/spadesSRR18138815/transcripts.fasta Время выполнения: 0 минут 12.817 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138815/quast Выходные данные: report.pdf 43.3 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.55 Мб Команда: busco Параметры: time busco -i /mnt/r840_storage/gentech/a.e.krokhina/SRR18138815/spadesSRR18138815/transcripts.fasta -l /mnt/san01/a.e.krokhina/insecta_odb10/ -o busco -m transcriptome -f --offline -c 64 Время выполнения: 4 минут 34.805 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138815/busco Выходные данные: full_table.tsv 449 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 73.5 Мб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 19.09.2022 № 6 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина srv_r940 Рабочий диск /mnt/san01 Папка назначения /mnt/r840_storage/gentech/a.e.krokhina/SRR12626143/ Содержание папки назначения до копирования нет 1.2. Место назначения для загрузки адрес виртуальной машины 10.230.206.2 папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR18138818/SRR18138818 формат исходных данных .sra объем исходных данных 2.2 Гб 1.3. Проведение копирования Команда: prefetch  Параметры: time prefetch SRR18138818 Время выполнения: 0 минут 1.114 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR12626143/ Выходные данные: SRR18138818.sra 2.2 Гб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 19.09.2022 № 7 ( ) не заполняется 2.1. Наименование виртуальной машины: srv_r940 2.2. Конфигурация машины: 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 19.09.2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 SRR18138818 Время выполнения: 2 минут 52.513 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138818 Выходные данные: SRR18138818_1.fastq 8.26 Гб SRR18138818_2.fastq 8.26 Гб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR18138818_1.fastq Время выполнения: 3 минут 41.267 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138818 Выходные данные: SRR18138818_1_fastqc.html 579 Кб SRR18138818_1_fastqc.zip 341 Кб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR18138818_2.fastq Время выполнения: 3 минут 31.542 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138818 Выходные данные: SRR18138818_2_fastqc.html 579 Кб SRR18138818_2_fastqc.zip 345 Кб Команда: trimmomatic Параметры: time java -jar /soft/trimmomatic/Trimmomatic-0.39/trimmomatic-0.39.jar PE -threads 64 -phred33 SRR18138818_1.fastq SRR18138818_2.fastq SRR18138818_1_1P.fq.gz SRR18138818_1_1U.fq.gz SRR18138818_2_2P.fq.gz SRR18138818_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 Время выполнения: 15 минут 11.826 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138818 Выходные данные: SRR18138818_1_1P.fq.gz 1.58 Гб SRR18138818_1_1U.fq.gz 7.75 Мб SRR18138818_2_2P.fq.gz 1.64 Гб SRR18138818_2_2U.fq.gz 7.47 Мб Команда: spades Параметры: time /soft/python/3.10.4/bin/python3 /soft/spades/SPAdes-3.15.4-Linux/bin/rnaspades.py -t 64 --pe-1 1 SRR18138818_1_1P.fq.gz --pe-2 1 SRR18138818_2_2P.fq.gz -o spadesSRR18138818 Время выполнения: 243 минут 9.194 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138818/spadesSRR18138818 Выходные данные: transcripts.fasta 109 Мб Другие папки и файлы: pipeline_state tmp K73 K49 misc spades.log transcripts.paths transcripts.fasta soft_filtered_transcripts.fasta hard_filtered_transcripts.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg before_rr.fasta run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 1.67 Гб Команда: quast Параметры: time /soft/python/3.10.4/bin/python3 /soft/quast/quast-5.0.2/quast.py -t 64 -o QUAST --pe1 SRR18138818_1_1P.fq.gz --pe2 SRR18138818_2_2P.fq.gz /mnt/r840_storage/gentech/a.e.krokhina/SRR18138818/spadesSRR18138818/transcripts.fasta Время выполнения: 0 минут 18.498 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138818/quast Выходные данные: report.pdf 39.7 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.49 Мб Команда: busco Параметры: time busco -i /mnt/r840_storage/gentech/a.e.krokhina/SRR18138818/spadesSRR18138818/transcripts.fasta -l /mnt/san01/a.e.krokhina/insecta_odb10/ -o busco -m transcriptome -f --offline -c 64 Время выполнения: 5 минут 22.054 секунд  Размещение выходных файлов (папка): /mnt/r840_storage/gentech/a.e.krokhina/SRR18138818/busco Выходные данные: full_table.tsv 611 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 112 Мб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 21.08.2022 № 7 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина srv_r940 Рабочий диск /mnt/san01 Папка назначения /mnt/san01/a.e.krokhina/RR12432354/ Содержание папки назначения до копирования нет 1.2. Место назначения для загрузки адрес виртуальной машины 10.230.206.2 название монтированного сетевого диска: /mnt/san01 папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR12432354/SRR12432354 формат исходных данных .sra объем исходных данных 932.8 Мб 1.3. Проведение копирования Команда: prefetch  Параметры: time prefetch SRR12432354 Время выполнения: 2 минут 43.675 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/RR12432354 Выходные данные: SRR12432354.sra 932.8 Mб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 21.08.2022 № 3 ( ) не заполняется 2.1. Наименование виртуальной машины: srv_r940 2.2. Конфигурация машины: 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 21.08.2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 SRR12432354 Время выполнения: 1 минут 2.421 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/RR12432354 Выходные данные: SRR12432354_1.fastq 2.95 Гб SRR12432354_2.fastq 2.95 Гб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR12432354_1.fastq Время выполнения:  0 минут 50.242 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/RR12432354 Выходные данные: SRR12432354_1_fastqc.html 555 Кб SRR12432354_1_fastqc.zip 355 Кб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR12432354_2.fastq Время выполнения: 0 минут 50.499 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/RR12432354 Выходные данные: SRR12432354_2_fastqc.html 558 Кб SRR12432354_2_fastqc.zip 358 Кб Команда: trimmomatic Параметры: time java -jar /soft/trimmomatic/Trimmomatic-0.39/trimmomatic-0.39.jar PE -threads 64 -phred33 RR12432354_1.fastq RR12432354_2.fastq RR12432354_1_1P.fq.gz RR12432354_1_1U.fq.gz RR12432354_2_2P.fq.gz RR12432354_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 Время выполнения: 3 минут 38.863 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/RR12432354 Выходные данные: SRR12432354_1_1P.fq.gz 522 Мб SRR12432354_1_1U.fq.gz 9.69 Мб SRR12432354_2_2P.fq.gz 588 Мб SRR12432354_2_2U.fq.gz 650 Кб Команда: spades Параметры: time /soft/python/3.10.4/bin/python3 /soft/spades/SPAdes-3.15.4-Linux/bin/spades.py -t 64 --pe-1 1 RR12432354_1_1P.fq.gz --pe-2 1 RR12432354_2_2P.fq.gz -o spadesRR12432354 Время выполнения: 365 минут 45.051 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/RR12432354/spadesSRR12432354 Выходные данные: contigs.fasta 31.8 Гб Другие папки и файлы: pipeline_state tmp misc K127 K99 K77 K55 K33 K21 corrected warnings.log spades.log scaffolds.paths scaffolds.fasta contigs.paths contigs.fasta before_rr.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 1.94 Гб Команда: quast Параметры: time /soft/python/3.10.4/bin/python3 /soft/quast/quast-5.0.2/quast.py -t 64 -o QUAST --pe1 RR12432354_1_1P.fq.gz --pe2 RR12432354_2_2P.fq.gz /spadesRR12432354/contigs.fasta Время выполнения: 0 минут 3.089 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/RR12432354/QUAST Выходные данные: report.pdf 30.2 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.37 Мб Команда: busco Параметры: time busco -i /spadesRR12432354/contigs.fasta -l /mnt/san01/a.e.krokhina/insecta_odb10/ -o busco -m genome -f --offline -c 64 Время выполнения: 10 минут 39.695 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/RR12432354/busco Выходные данные: full_table.tsv 36.0 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 108 Мб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 12.07.2022 № 8 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина srv_r940 Рабочий диск /mnt/san01 Папка назначения /mnt/san01/a.e.krokhina/SRR12626143/ Содержание папки назначения до копирования нет 1.2. Место назначения для загрузки адрес виртуальной машины 10.230.206.2 папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR12626143/SRR12626143 формат исходных данных .sra объем исходных данных 98.3 Мб 1.3. Проведение копирования Команда: prefetch  Параметры: time prefetch SRR12626143 Время выполнения: 1 минут 10.476 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143/ Выходные данные: SRR12626143.sra 98.3 Mб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 12.07.2022 № 1 ( ) не заполняется 2.1. Наименование виртуальной машины: srv_r940 2.2. Конфигурация машины: 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 12.07.2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: cd SRR12626143 time fastq-dump --split-3 SRR12626143 Время выполнения: 0 минут 3.241 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143/ Выходные данные: SRR12626143_1.fastq 225 Мб SRR12626143_2.fastq 226 Мб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR12626143_1.fastq Время выполнения: 0 минут 7.224 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143/ Выходные данные: SRR12626143_1_fastqc.html 664 Кб SRR12626143_1_fastqc.zip 322 Кб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR12626143_2.fastq Время выполнения: 0 минут 9.342 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143/ Выходные данные: SRR12626143_2_fastqc.html 656 Кб SRR12626143_2_fastqc.zip 321 Кб Команда: trimmomatic Параметры: time java -jar /soft/trimmomatic/Trimmomatic-0.39/trimmomatic-0.39.jar PE -threads 64 -phred33 SRR18153691_1.fastq SRR18153691_2.fastq SRR18153691_1_1P.fq.gz SRR18153691_1_1U.fq.gz SRR18153691_2_2P.fq.gz SRR18153691_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 Время выполнения: 0 минут 18.740 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143/ Выходные данные: SRR12626143_1_1P.fq.gz 49.2 Мб SRR12626143_1_1U.fq.gz 3.33 Мб SRR12626143_2_2P.fq.gz 58.6 Мб SRR12626143_2_2U.fq.gz 503 Кб Команда: spades Параметры: time /soft/python/3.10.4/bin/python3 /soft/spades/SPAdes-3.15.4-Linux/bin/spades.py -t 64 --pe-1 1 SRR18153691_1_1P.fq.gz --pe-2 1 SRR18153691_2_2P.fq.gz -o spadesSRR18153691 Время выполнения: 10 минут 22.113 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143/spadesSRR12626143 Выходные данные: contigs.fasta 2.39 Мб Другие папки и файлы: pipeline_state tmp misc K127 K99 K77 K55 K33 K21 corrected warnings.log spades.log scaffolds.paths scaffolds.fasta contigs.paths contigs.fasta before_rr.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 158 Мб Команда: quast Параметры: time /soft/python/3.10.4/bin/python3 /soft/quast/quast-5.0.2/quast.py -t 64 -o QUAST --pe1 SRR18153691_1_1P.fq.gz --pe2 SRR18153691_2_2P.fq.gz /spadesSRR18153691/contigs.fasta Время выполнения: 0 минут 1.298 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143/QUAST Выходные данные: report.pdf 35.2 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.37 Мб Команда: busco Параметры: time busco -i /spadesSRR18153691/contigs.fasta -l /mnt/san01/a.e.krokhina/insecta_odb10/ -o busco -m genome -f --offline -c 64 Время выполнения: 2 минут 11.370 секунд Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143/busco Выходные данные: full_table.tsv 54.6 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 103 Мб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 20.08.2022 № 9 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина srv_r940 Рабочий диск /mnt/san01 Папка назначения /mnt/san01/a.e.krokhina/SRR12626143/ Содержание папки назначения до копирования нет 1.2. Место назначения для загрузки адрес виртуальной машины 10.230.206.2 название монтированного сетевого диска: /mnt/san01 папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR12626150/SRR12626150 формат исходных данных .sra объем исходных данных 21.6 Мб дата/время создания файлов 22.03.2021 1.3. Проведение копирования Команда: prefetch  Параметры: time prefetch SRR12626143 Время выполнения: 0 минут 8.984 секунд Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143 Выходные данные: SRR12626150.sra 21.6 Мб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 20.08.2022 № 2 ( ) не заполняется 2.1. Наименование виртуальной машины: srv_r940 2.2. Конфигурация машины: 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 20.08.2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: cd SRR12626150 time fastq-dump --split-3 SRR12626150 Время выполнения: 0 минут 29.006 секунд Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143 Выходные данные: SRR12626150_1.fastq 74.3 Мб SRR12626150_2.fastq 73.5 Мб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR12626150_1.fastq Время выполнения: 0 минут 4.129 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143 Выходные данные: SRR12626150_1_fastqc.html 246 Кб SRR12626150_1_fastqc.zip 272 Кб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR12626150_2.fastq Время выполнения: 0 минут 3.789 секунд   Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143 Выходные данные: SRR12626150_2_fastqc.html 241 Кб SRR12626150_2_fastqc.zip 266 Кб Команда: trimmomatic Параметры: time java -jar /soft/trimmomatic/Trimmomatic-0.39/trimmomatic-0.39.jar PE -threads 64 -phred33 SRR18153691_1.fastq SRR18153691_2.fastq SRR18153691_1_1P.fq.gz SRR18153691_1_1U.fq.gz SRR18153691_2_2P.fq.gz SRR18153691_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 Время выполнения: 0 минут 6.998 секунд   Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143 Выходные данные: SRR12626150_1_1P.fq.gz 13.7 Мб SRR12626150_1_1U.fq.gz 108 Кб SRR12626150_2_2P.fq.gz 14.0 Мб SRR12626150_2_2U.fq.gz 43.7 Кб Команда: spades Параметры: time /soft/python/3.10.4/bin/python3 /soft/spades/SPAdes-3.15.4-Linux/bin/spades.py -t 64 --pe-1 1 SRR18153691_1_1P.fq.gz --pe-2 1 SRR18153691_2_2P.fq.gz -o spadesSRR18153691 Время выполнения: 2 минут 12.001 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143/spadesSRR12626150 Выходные данные: contigs.fasta 45.9 Кб Другие папки и файлы: pipeline_state tmp misc K127 K99 K77 K55 K33 K21 corrected warnings.log spades.log scaffolds.paths scaffolds.fasta contigs.paths contigs.fasta before_rr.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 28.7 Мб Команда: quast Параметры: time /soft/python/3.10.4/bin/python3 /soft/quast/quast-5.0.2/quast.py -t 64 -o QUAST --pe1 SRR18153691_1_1P.fq.gz --pe2 SRR18153691_2_2P.fq.gz /spadesSRR18153691/contigs.fasta Время выполнения: 0 минут 22.010 секунд Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143/QUAST Выходные данные: report.pdf 28.9 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.26 Мб Команда: busco Параметры: time busco -i /spadesSRR18153691/contigs.fasta -l /mnt/san01/a.e.krokhina/insecta_odb10/ -o busco -m genome -f --offline -c 64 Время выполнения: 0 минут 48.985 секунд Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626143/busco Выходные данные: full_table.tsv 29.6 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 105 Мб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 21.08.2022 № 10 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина srv_r940 Рабочий диск /mnt/san01 Папка назначения /mnt/san01/a.e.krokhina/SRR12626233/ Содержание папки назначения до копирования нет 1.2. Место назначения для загрузки адрес виртуальной машины 10.230.206.2 название монтированного сетевого диска: /mnt/san01 папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR12626233 формат исходных данных .sra объем исходных данных 46.6 Мб 1.3. Проведение копирования Команда: prefetch  Параметры: time prefetch SRR12626233 Время выполнения: 3 минут 40.186 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626233 Выходные данные: SRR12626233.sra 46.6 Mб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 12.07.2022 № 1 ( ) не заполняется 2.1. Наименование виртуальной машины: srv_r940 2.2. Конфигурация машины: 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 12.07.2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 SRR12626233 Время выполнения: 6 минут 31.928 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626233 Выходные данные: SRR12626233_1.fastq 126 Мб SRR12626233_2.fastq 138 Мб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR12626233_1.fastq Время выполнения: 0 минут 17.251 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626233 Выходные данные: SRR12626233_1_fastqc.html 663 Кб SRR12626233_1_fastqc.zip 314 Кб Команда: fastqc Параметры: time fastqc --extract -f fastq -c SRR12626233_2.fastq Время выполнения: 0 минут 15.952 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626233 Выходные данные: SRR12626233_2_fastqc.html 653 Кб SRR12626233_2_fastqc.zip 319 Кб Команда: trimmomatic Параметры: time java -jar /soft/trimmomatic/Trimmomatic-0.39/trimmomatic-0.39.jar PE -threads 64 -phred33 SRR12626233_1.fastq SRR12626233_2.fastq SRR12626233_1_1P.fq.gz SRR12626233_1_1U.fq.gz SRR12626233_2_2P.fq.gz SRR12626233_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 Время выполнения: 1 минут 23.181 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626233 Выходные данные: SRR12626233_1_1P.fq.gz 119 Мб SRR12626233_1_1U.fq.gz 6.17 Мб SRR12626233_2_2P.fq.gz 138 Мб SRR12626233_2_2U.fq.gz 504 Кб Команда: spades Параметры: time /soft/python/3.10.4/bin/python3 /soft/spades/SPAdes-3.15.4-Linux/bin/spades.py -t 64 --pe-1 1 SRR12626233_1_1P.fq.gz --pe-2 1 SRR12626233_2_2P.fq.gz -o spadesSRR12626233 Время выполнения: 21 минут 10.637 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626233/spadesSRR12626233 Выходные данные: contigs.fasta 6.07 Мб Другие папки и файлы: pipeline_state tmp misc K127 K99 K77 K55 K33 K21 corrected warnings.log spades.log scaffolds.paths scaffolds.fasta contigs.paths contigs.fasta before_rr.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 369 Мб Команда: quast Параметры: time /soft/python/3.10.4/bin/python3 /soft/quast/quast-5.0.2/quast.py -t 64 -o QUAST --pe1 SRR12626233_1_1P.fq.gz --pe2 SRR12626233_2_2P.fq.gz /mnt/san01/a.e.krokhina/SRR12626233/spadesSRR12626233/contigs.fasta Время выполнения: 0 минут 2.318 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626233/QUAST Выходные данные: report.pdf 36.3 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.38 Мб Команда: busco Параметры: time busco -i /mnt/san01/a.e.krokhina/SRR12626233/spadesSRR12626233/contigs.fasta -l /mnt/san01/a.e.krokhina/insecta_odb10/ -o busco -m genome -f --offline -c 64 Время выполнения: 3 минут 36.743 секунд  Размещение выходных файлов (папка): /mnt/san01/a.e.krokhina/SRR12626233/busco Выходные данные: full_table.tsv 64.7 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 102 Мб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 4 сентября 2022 № 11 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина illumina (Yandex.Cloud) Рабочий диск vdb1 Папка назначения /mnt/vdb1/SRA/sra Содержание папки назначения до копирования нет 1.2. Место назначения для загрузки адрес виртуальной машины динамический название монтированного сетевого диска: vdb1 папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/ERR6054958/ERR6054958 формат исходных данных .sra объем исходных данных 6.4 Гб дата/время создания файлов 22.03.2021 1.3. Проведение копирования Команда: prefetch  Параметры: export PATH=$PATH:$PWD/sratoolkit.3.0.0-ubuntu64/bin/ time prefetch ERR6054958 Время выполнения: 0 минут 30.563 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRA/sra Выходные данные: ERR6054958.sra 6.4 Гб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 4 сентября 2022 № 11 ( ) не заполняется 2.1. Наименование виртуальной машины: illumina 2.2. Конфигурация машины: Intel Ice Lake (Yandex.Cloud) 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 4 сентября 2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 ERR6054958 Время выполнения: 0 минут 43.423 секунд  Размещение выходных файлов (папка): /mnt/vdb1/ERR6054958 Выходные данные: ERR6054958_1.fastq 2.95 Гб ERR6054958_2.fastq 2.95 Гб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c ERR6054958_1.fastq conda deactivate Время выполнения: 0 минут 32.272 секунд  Размещение выходных файлов (папка): /mnt/vdb1/ERR6054958 Выходные данные: ERR6054958_1_fastqc.html 555 Кб ERR6054958_1_fastqc.zip 355 Кб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c ERR6054958_2.fastq conda deactivate Время выполнения: 0 минут 50.250 секунд  Размещение выходных файлов (папка): /mnt/vdb1/ERR6054958 Выходные данные: ERR6054958_2_fastqc.html 558 Кб ERR6054958_2_fastqc.zip 358 Кб Команда: trimmomatic Параметры: conda activate trimmomatic time trimmomatic PE -threads 64 -phred33 ERR6054958_1.fastqERR6054958_2.fastq ERR6054958_1_1P.fq.gz ERR6054958_1_1U.fq.gz  ERR6054958_2_2P.fq.gzERR6054958_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 conda deactivate Время выполнения: 1 минут 48.235 секунд  Размещение выходных файлов (папка): /mnt/vdb1/ERR6054958 Выходные данные: ERR6054958_1_1P.fq.gz 522 Мб ERR6054958_1_1U.fq.gz 9.69 Мб ERR6054958_2_2P.fq.gz 588 Мб ERR6054958_2_2U.fq.gz 650 Кб Команда: spades Параметры: time /home/illumina/mydevice/SPAdes-3.14.1-Linux/bin/spades.py -t 64 --pe-1 1 ERR6054958_1_1P.fq.gz --pe-2 1 ERR6054958_2_2P.fq.gz -o spadesERR6054958 Время выполнения: 30 минут 14.752 секунд  Размещение выходных файлов (папка): /mnt/vdb1/ERR6054958/spadesERR6054958 Выходные данные: contigs.fasta 31.8 Гб Другие папки и файлы: pipeline_state tmp misc K127 K99 K77 K55 K33 K21 corrected warnings.log spades.log scaffolds.paths scaffolds.fasta contigs.paths contigs.fasta before_rr.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 1.94 Гб Команда: quast Параметры: time python /home/illumina/mydevice/quast-5.0.2/quast.py -t 64 -o /home/illumina/mydevice/a.krokhina/quast/ --pe1 /home/illumina/mydevice/a.krokhina/ERR6054958_1_1P.fq.gz --pe2 /home/illumina/mydevice/a.krokhina/ERR6054958_2_2P.fq.gz /home/illumina/mydevice/a.krokhina/spadesERR6054958/contigs.fasta Время выполнения: 0 минут 2.727 секунд  Размещение выходных файлов (папка): /mnt/vdb1/ERR6054958/QUAST Выходные данные: report.pdf 30.2 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.38 Мб Команда: busco Параметры: time busco -i /mnt/vdb1/ERR6054958/spadesERR6054958/contigs.fasta -l /mnt/vdb1/insecta_odb10/ -o busco -m genome -f --offline -c 64 Время выполнения: 6 минут 8.270 секунд  Размещение выходных файлов (папка): /mnt/vdb1/ERR6054958/busco Выходные данные: full_table.tsv 36.0 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 107 Мб Команда: prodigal Параметры: source ~/.bashrc conda activate prodigal cd ERR6054958 time prodigal -i /mnt/vdb1/ERR6054958/spadesERR6054958/contigs.fasta -a queriesERR6054958.faa conda deactivate Время выполнения: 0 минут 1.961 секунд Размещение выходных файлов (папка): /mnt/vdb1/ERR6054958/ Выходные данные: ERR6054958.faa 16.8 Мб Команда: diamond Параметры: conda activate diamond time diamond blastp -d /mnt/vdb1/P450_diamond_db_aug2022.dmnd -q queriesERR6054958.faa -o matches_p.tsv --threads 64 --outfmt 6 conda deactivate cd .. Время выполнения: 0 минут 0.398471 секунд Размещение выходных файлов (папка): /mnt/vdb1/ERR6054958/ Выходные данные: matches_pERR6054958.tsv 32.2 Кб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 21 августа 2022 № 12 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина illumina (Yandex.Cloud) Рабочий диск vdb1 Папка назначения /mnt/vdb1/SRA/sra 1.2. Место назначения для загрузки адрес виртуальной машины динамический папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR15992415/SRR15992415 формат исходных данных .sra объем исходных данных 8.9 Гб 1.3. Проведение копирования Команда: prefetch  Параметры: export PATH=$PATH:$PWD/sratoolkit.3.0.0-ubuntu64/bin/ time prefetch SRR15992415 Время выполнения: 0 минут 1.114 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRA/sra Выходные данные: SRR15992415.sra 8.9 Гб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 21 августа 2022 № 12 ( ) не заполняется 2.1. Наименование виртуальной машины: illumina 2.2. Конфигурация машины: Intel Ice Lake (Yandex.Cloud) 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 21 августа 2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 SRR15992415 Время выполнения: 2 минут 52.513 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415 Выходные данные: SRR15992415_1.fastq 30.3 Гб SRR15992415_2.fastq 30.3 Гб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR15992415_1.fastq conda deactivate Время выполнения: 2 минут 33.218 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415 Выходные данные: SRR15992415_1_fastqc.html 229 Кб SRR15992415_1_fastqc.zip 252 Кб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR15992415_2.fastq conda deactivate Время выполнения: 2 минут 27.262 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415 Выходные данные: SRR15992415_2_fastqc.html 222 Кб SRR15992415_2_fastqc.zip 243 Кб Команда: trimmomatic Параметры: conda activate trimmomatic time trimmomatic PE -threads 64 -phred33 SRR15992415_1.fastqSRR15992415_2.fastq SRR15992415_1_1P.fq.gz SRR15992415_1_1U.fq.gz  SRR15992415_2_2P.fq.gzSRR15992415_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 conda deactivate Время выполнения: 11 минут 33.163 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415 Выходные данные: SRR15992415_1_1P.fq.gz 6.00 Гб SRR15992415_1_1U.fq.gz 150 Мб SRR15992415_2_2P.fq.gz 6.71 Гб SRR15992415_2_2U.fq.gz 3.84 Мб Команда: spades Параметры: time /mnt/vdb1/SPAdes-3.14.1-Linux/bin/rnaspades.py -t 64 --pe-1 1 SRR15992415_1_1P.fq.gz --pe-2 1 SRR15992415_2_2P.fq.gz -o rnaspadesSRR15992415 Время выполнения: 234 минут 39.472 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415/spadesSRR15992415 Выходные данные: transcripts.fasta 123 Мб Другие папки и файлы: pipeline_state tmp K73 K49 misc spades.log transcripts.paths transcripts.fasta soft_filtered_transcripts.fasta hard_filtered_transcripts.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg before_rr.fasta run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 1.84 Гб Команда: quast Параметры: conda activate quast mkdir quast time quast -t 64 -o quast --pe1 SRR15992415_1_1P.fq.gz --pe2 SRR15992415_2_2P.fq.gz /mnt/vdb1/rnaSRR15992415/rnaspadesSRR15992415/transcripts.fasta Время выполнения: 0 минут 1.652 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415/quast Выходные данные: report.pdf 43.3 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.55 Мб Команда: busco Параметры: conda activate busco time busco -i /mnt/vdb1/rnaSRR15992415/rnaspadesSRR15992415/transcripts.fasta -l /mnt/vdb1/insecta_odb10/ -o busco -m transcriptome -f --offline -c 64 conda deactivate Время выполнения: 0 минут 10.536 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415/busco Выходные данные: full_table.tsv 449 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 73.5 Мб Команда: prodigal Параметры: source ~/.bashrc conda activate prodigal cd SRR15992415 time prodigal -i /mnt/vdb1/SRR15992415/spadesSRR15992415/contigs.fasta -a queriesSRR15992415.faa conda deactivate Время выполнения: 0 минут 1.324 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415/ Выходные данные: SRR15992415.faa 43.2 Мб Команда: diamond Параметры: conda activate diamond time diamond blastp -d /mnt/vdb1/P450_diamond_db_aug2022.dmnd -q queriesSRR15992415.faa -o matches_p.tsv --threads 64 --outfmt 6 conda deactivate cd .. Время выполнения: 0 минут 2.73566 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR15992415/ Выходные данные: matches_pSRR15992415.tsv 1.31 Мб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 4 сентября 2022 № 13 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина illumina (Yandex.Cloud) Рабочий диск vdb1 Папка назначения /mnt/vdb1/SRA/sra Содержание папки назначения до копирования нет 1.2. Место назначения для загрузки адрес виртуальной машины динамический название монтированного сетевого диска: vdb1 папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR15992420/SRR15992420 формат исходных данных .sra объем исходных данных 5.1 Гб 1.3. Проведение копирования Команда: prefetch  Параметры: export PATH=$PATH:$PWD/sratoolkit.3.0.0-ubuntu64/bin/ time prefetch SRR15992420 Время выполнения: 5 минут 16.711 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRA/sra Выходные данные: SRR15992420.sra 5.1 Гб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 4 сентября 2022 № 13 ( ) не заполняется 2.1. Наименование виртуальной машины: illumina 2.2. Конфигурация машины: Intel Ice Lake (Yandex.Cloud) 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 4 сентября 2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 SRR15992420 Время выполнения: 10 минут 44.165 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992420 Выходные данные: SRR15992420_1.fastq 20.5 Гб SRR15992420_2.fastq 20.5 Гб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR15992420_1.fastq conda deactivate Время выполнения: 10 минут 44.782 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992420 Выходные данные: SRR15992420_1_fastqc.html 546 Кб SRR15992420_1_fastqc.zip 337 Кб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR15992420_2.fastq conda deactivate Время выполнения: 10 минут 34.395 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992420 Выходные данные: SRR15992420_2_fastqc.html 551 Кб SRR15992420_2_fastqc.zip 338 Кб Команда: trimmomatic Параметры: conda activate trimmomatic time trimmomatic PE -threads 64 -phred33 SRR15992420_1.fastqSRR15992420_2.fastq SRR15992420_1_1P.fq.gz SRR15992420_1_1U.fq.gz  SRR15992420_2_2P.fq.gzSRR15992420_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 conda deactivate Время выполнения: 28 минут 16.532 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992420 Выходные данные: SRR15992420_1_1P.fq.gz 3.79 Гб SRR15992420_1_1U.fq.gz 34.4 Мб SRR15992420_2_2P.fq.gz 3.84 Гб SRR15992420_2_2U.fq.gz 1.46 Мб Команда: spades Параметры: time /mnt/vdb1/SPAdes-3.14.1-Linux/bin/rnaspades.py -t 64 --pe-1 1 SRR15992420_1_1P.fq.gz --pe-2 1 SRR15992420_2_2P.fq.gz -o rnaspadesSRR15992420 Время выполнения: 355 минут 19.418 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992420/spadesSRR15992420 Выходные данные: transcripts.fasta 78.6 Мб Другие папки и файлы: pipeline_state tmp K73 K49 misc spades.log transcripts.paths transcripts.fasta soft_filtered_transcripts.fasta hard_filtered_transcripts.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg before_rr.fasta run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 1.12 Гб Команда: quast Параметры: conda activate quast mkdir quast time quast -t 64 -o quast --pe1 SRR15992420_1_1P.fq.gz --pe2 SRR15992420_2_2P.fq.gz /mnt/vdb1/rnaSRR15992420/rnaspadesSRR15992420/transcripts.fasta Время выполнения: 0 минут 10.592 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992420/quast Выходные данные: report.pdf 39.0 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.52 Мб Команда: busco Параметры: conda activate busco time busco -i /mnt/vdb1/rnaSRR15992420/rnaspadesSRR15992420/transcripts.fasta -l /mnt/vdb1/insecta_odb10/ -o busco -m transcriptome -f --offline -c 64 conda deactivate Время выполнения: 12 минут 8.454 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR15992420/busco Выходные данные: full_table.tsv 381 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 49.9 Мб Команда: prodigal Параметры: source ~/.bashrc conda activate prodigal cd SRR15992420 time prodigal -i /mnt/vdb1/SRR15992420/spadesSRR15992420/contigs.fasta -a queriesSRR15992420.faa conda deactivate Время выполнения: 0 минут 3.679 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR15992420/ Выходные данные: SRR15992420.faa 25.3 Мб Команда: diamond Параметры: conda activate diamond time diamond blastp -d /mnt/vdb1/P450_diamond_db_aug2022.dmnd -q queriesSRR15992420.faa -o matches_p.tsv --threads 64 --outfmt 6 conda deactivate cd .. Время выполнения: 0 минут 4.1999 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR15992420/ Выходные данные: matches_pSRR15992420.tsv 798 Кб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 4 сентября 2022 № 14 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина illumina (Yandex.Cloud) Папка назначения /mnt/vdb1/SRA/sra 1.2. Место назначения для загрузки адрес виртуальной машины динамический папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR18138813/SRR18138813 формат исходных данных /mnt/vdb1/SRA/sra объем исходных данных 2.0 Гб 1.3. Проведение копирования Команда: prefetch  Параметры: export PATH=$PATH:$PWD/sratoolkit.3.0.0-ubuntu64/bin/ time prefetch SRR18138813 Время выполнения: 0 минут 50.685 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRA/sra Выходные данные: SRR18138813.sra 2.0 Гб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 4 сентября 2022 № 14 ( ) не заполняется 2.1. Наименование виртуальной машины: illumina 2.2. Конфигурация машины: Intel Ice Lake (Yandex.Cloud) 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 4 сентября 2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 SRR18138813 Время выполнения: 2 минут 42.247 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138813 Выходные данные: SRR18138813_1.fastq 7.72 Гб SRR18138813_2.fastq 7.72 Гб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR18138813_1.fastq conda deactivate Время выполнения: 2 минут 47.352 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138813 Выходные данные: SRR18138813_1_fastqc.html 232 Кб SRR18138813_1_fastqc.zip 256 Кб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR18138813_2.fastq conda deactivate Время выполнения: 2 минут 29.294 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138813 Выходные данные: SRR18138813_2_fastqc.html 230 Кб SRR18138813_2_fastqc.zip 252 Кб Команда: trimmomatic Параметры: conda activate trimmomatic time trimmomatic PE -threads 64 -phred33 SRR18138813_1.fastqSRR18138813_2.fastq SRR18138813_1_1P.fq.gz SRR18138813_1_1U.fq.gz  SRR18138813_2_2P.fq.gzSRR18138813_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 conda deactivate Время выполнения: 10 минут 42.762 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138813 Выходные данные: SRR18138813_1_1P.fq.gz 1.46 Гб SRR18138813_1_1U.fq.gz 4.95 Мб SRR18138813_2_2P.fq.gz 1.48 Гб SRR18138813_2_2U.fq.gz 3.42 Мб Команда: spades Параметры: time /mnt/vdb1/SPAdes-3.14.1-Linux/bin/rnaspades.py -t 64 --pe-1 1 SRR18138813_1_1P.fq.gz --pe-2 1 SRR18138813_2_2P.fq.gz -o rnaspadesSRR18138813 Время выполнения: 154 минут 42.654 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138813/spadesSRR18138813 Выходные данные: transcripts.fasta 99.9 Мб Другие папки и файлы: pipeline_state tmp K73 K49 misc spades.log transcripts.paths transcripts.fasta soft_filtered_transcripts.fasta hard_filtered_transcripts.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg before_rr.fasta run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 1.54 Гб Команда: quast Параметры: conda activate quast mkdir quast time quast -t 64 -o quast --pe1 SRR18138813_1_1P.fq.gz --pe2 SRR18138813_2_2P.fq.gz /mnt/vdb1/rnaSRR18138813/rnaspadesSRR18138813/transcripts.fasta Время выполнения: 0 минут 0.102 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138813/quast Выходные данные: report.pdf 37.3 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.49 Мб Команда: busco Параметры: conda activate busco time busco -i /mnt/vdb1/rnaSRR18138813/rnaspadesSRR18138813/transcripts.fasta -l /mnt/vdb1/insecta_odb10/ -o busco -m transcriptome -f --offline -c 64 conda deactivate Время выполнения: 0 минут 0.534 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138813/busco Выходные данные: full_table.tsv 92.3 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 481 Мб Команда: prodigal Параметры: source ~/.bashrc conda activate prodigal cd SRR18138813 time prodigal -i /mnt/vdb1/SRR18138813/spadesSRR18138813/contigs.fasta -a queriesSRR18138813.faa conda deactivate Время выполнения: 0 минут 2.988 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR18138813/ Выходные данные: SRR18138813.faa 32.0 Мб Команда: diamond Параметры: conda activate diamond time diamond blastp -d /mnt/vdb1/P450_diamond_db_aug2022.dmnd -q queriesSRR18138813.faa -o matches_p.tsv --threads 64 --outfmt 6 conda deactivate cd .. Время выполнения: 0 минут 4.08319 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR18138813/ Выходные данные: matches_pSRR18138813.tsv 1.49 Мб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 4 сентября 2022 № 15 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина illumina (Yandex.Cloud) Рабочий диск vdb1 Папка назначения /mnt/vdb1/SRA/sra 1.2. Место назначения для загрузки адрес виртуальной машины динамический папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR18138815/SRR18138815 формат исходных данных /mnt/vdb1/SRA/sra объем исходных данных 2.1 Гб 1.3. Проведение копирования Команда: prefetch  Параметры: export PATH=$PATH:$PWD/sratoolkit.3.0.0-ubuntu64/bin/ time prefetch SRR18138815 Время выполнения: 0 минут 1.114 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRA/sra Выходные данные: SRR18138815.sra 2.1 Гб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 4 сентября 2022 № 15 ( ) не заполняется 2.1. Наименование виртуальной машины: illumina 2.2. Конфигурация машины: Intel Ice Lake (Yandex.Cloud) 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 4 сентября 2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 SRR18138815 Время выполнения: 2 минут 52.513 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138815 Выходные данные: SRR18138815_1.fastq 8.11 Гб SRR18138815_2.fastq 8.11 Гб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR18138815_1.fastq conda deactivate Время выполнения: 2 минут 33.218 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138815 Выходные данные: SRR18138815_1_fastqc.html 582 Кб SRR18138815_1_fastqc.zip 351 Кб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR18138815_2.fastq conda deactivate Время выполнения: 2 минут 27.262 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138815 Выходные данные: SRR18138815_2_fastqc.html 579 Кб SRR18138815_2_fastqc.zip 350 Кб Команда: trimmomatic Параметры: conda activate trimmomatic time trimmomatic PE -threads 64 -phred33 SRR18138815_1.fastqSRR18138815_2.fastq SRR18138815_1_1P.fq.gz SRR18138815_1_1U.fq.gz  SRR18138815_2_2P.fq.gzSRR18138815_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 conda deactivate Время выполнения: 11 минут 33.163 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138815 Выходные данные: SRR18138815_1_1P.fq.gz 1.50 Гб SRR18138815_1_1U.fq.gz 5.86 Мб SRR18138815_2_2P.fq.gz 1.55 Гб SRR18138815_2_2U.fq.gz 3.52 Мб Команда: spades Параметры: time /mnt/vdb1/SPAdes-3.14.1-Linux/bin/rnaspades.py -t 64 --pe-1 1 SRR18138815_1_1P.fq.gz --pe-2 1 SRR18138815_2_2P.fq.gz -o rnaspadesSRR18138815 Время выполнения: 234 минут 39.472 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138815/rnaspadesSRR18138815 Выходные данные: transcripts.fasta 88.4 Мб Другие папки и файлы: pipeline_state tmp K73 K49 misc spades.log transcripts.paths transcripts.fasta soft_filtered_transcripts.fasta hard_filtered_transcripts.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg before_rr.fasta run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 1.36 Гб Команда: quast Параметры: conda activate quast mkdir quast time quast -t 64 -o quast --pe1 SRR18138815_1_1P.fq.gz --pe2 SRR18138815_2_2P.fq.gz /mnt/vdb1/rnaSRR18138815/rnaspadesSRR18138815/transcripts.fasta Время выполнения: 0 минут 1.652 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138815/quast Выходные данные: report.pdf 43.3 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.55 Мб Команда: busco Параметры: conda activate busco time busco -i /mnt/vdb1/rnaSRR18138815/rnaspadesSRR18138815/transcripts.fasta -l /mnt/vdb1/insecta_odb10/ -o busco -m transcriptome -f --offline -c 64 conda deactivate Время выполнения: 0 минут 10.536 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138815/busco Выходные данные: full_table.tsv 449 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 73.5 Мб Команда: prodigal Параметры: source ~/.bashrc conda activate prodigal cd SRR18138815 time prodigal -i /mnt/vdb1/SRR18138815/spadesSRR18138815/contigs.fasta -a queriesSRR18138815.faa conda deactivate Время выполнения: 0 минут 1.324 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR18138815/ Выходные данные: SRR18138815.faa 43.2 Мб Команда: diamond Параметры: conda activate diamond time diamond blastp -d /mnt/vdb1/P450_diamond_db_aug2022.dmnd -q queriesSRR18138815.faa -o matches_p.tsv --threads 64 --outfmt 6 conda deactivate cd .. Время выполнения: 0 минут 2.73566 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR18138815/ Выходные данные: matches_pSRR18138815.tsv 1.31 Мб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 4 сентября 2022 № 16 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина illumina (Yandex.Cloud) Рабочий диск vdb1 Папка назначения /mnt/vdb1/SRA/sra 1.2. Место назначения для загрузки адрес виртуальной машины динамический папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR18138818/SRR18138818 формат исходных данных .sra объем исходных данных 2.2 Гб 1.3. Проведение копирования Команда: prefetch  Параметры: export PATH=$PATH:$PWD/sratoolkit.3.0.0-ubuntu64/bin/ time prefetch SRR18138818 Время выполнения: 0 минут 1.114 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRA/sra Выходные данные: SRR18138818.sra 2.2 Гб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 4 сентября 2022 № 16 ( ) не заполняется 2.1. Наименование виртуальной машины: illumina 2.2. Конфигурация машины: Intel Ice Lake (Yandex.Cloud) 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 4 сентября 2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 SRR18138818 Время выполнения: 2 минут 52.513 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138818 Выходные данные: SRR18138818_1.fastq 8.26 Гб SRR18138818_2.fastq 8.26 Гб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR18138818_1.fastq conda deactivate Время выполнения: 2 минут 33.218 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138818 Выходные данные: SRR18138818_1_fastqc.html 579 Кб SRR18138818_1_fastqc.zip 341 Кб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR18138818_2.fastq conda deactivate Время выполнения: 2 минут 27.262 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138818 Выходные данные: SRR18138818_2_fastqc.html 579 Кб SRR18138818_2_fastqc.zip 345 Кб Команда: trimmomatic Параметры: conda activate trimmomatic time trimmomatic PE -threads 64 -phred33 SRR18138818_1.fastqSRR18138818_2.fastq SRR18138818_1_1P.fq.gz SRR18138818_1_1U.fq.gz  SRR18138818_2_2P.fq.gzSRR18138818_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 conda deactivate Время выполнения: 11 минут 33.163 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138818 Выходные данные: SRR18138818_1_1P.fq.gz 1.58 Гб SRR18138818_1_1U.fq.gz 7.75 Мб SRR18138818_2_2P.fq.gz 1.64 Гб SRR18138818_2_2U.fq.gz 7.47 Мб Команда: spades Параметры: time /mnt/vdb1/SPAdes-3.14.1-Linux/bin/rnaspades.py -t 64 --pe-1 1 SRR18138818_1_1P.fq.gz --pe-2 1 SRR18138818_2_2P.fq.gz -o rnaspadesSRR18138818 Время выполнения: 234 минут 39.472 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138818/spadesSRR18138818 Выходные данные: transcripts.fasta 109 Мб Другие папки и файлы: pipeline_state tmp K73 K49 misc spades.log transcripts.paths transcripts.fasta soft_filtered_transcripts.fasta hard_filtered_transcripts.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg before_rr.fasta run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 1.67 Гб Команда: quast Параметры: conda activate quast mkdir quast time quast -t 64 -o quast --pe1 SRR18138818_1_1P.fq.gz --pe2 SRR18138818_2_2P.fq.gz /mnt/vdb1/rnaSRR18138818/rnaspadesSRR18138818/transcripts.fasta Время выполнения: 0 минут 1.652 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138818/quast Выходные данные: report.pdf 39.7 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.49 Мб Команда: busco Параметры: conda activate busco time busco -i /mnt/vdb1/rnaSRR18138818/rnaspadesSRR18138818/transcripts.fasta -l /mnt/vdb1/insecta_odb10/ -o busco -m transcriptome -f --offline -c 64 conda deactivate Время выполнения: 0 минут 10.536 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR18138818/busco Выходные данные: full_table.tsv 611 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 112 Мб Команда: prodigal Параметры: source ~/.bashrc conda activate prodigal cd SRR18138818 time prodigal -i /mnt/vdb1/SRR18138818/spadesSRR18138818/contigs.fasta -a queriesSRR18138818.faa conda deactivate Время выполнения: 0 минут 1.324 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR18138818/ Выходные данные: SRR18138818.faa 37.6 Мб Команда: diamond Параметры: conda activate diamond time diamond blastp -d /mnt/vdb1/P450_diamond_db_aug2022.dmnd -q queriesSRR18138818.faa -o matches_p.tsv --threads 64 --outfmt 6 conda deactivate cd .. Время выполнения: 0 минут 2.73566 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR18138818/ Выходные данные: matches_pSRR18138818.tsv 1.57 Мб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 4 сентября 2022 № 17 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина illumina (Yandex.Cloud) Рабочий диск vdb1 Папка назначения /mnt/vdb1/SRA/sra 1.2. Место назначения для загрузки адрес виртуальной машины динамический название монтированного сетевого диска: vdb1 папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR12432354/SRR12432354 формат исходных данных .sra 1.3. Проведение копирования Команда: prefetch  Параметры: export PATH=$PATH:$PWD/sratoolkit.3.0.0-ubuntu64/bin/ time prefetch SRR12432354 Время выполнения: 1 минут 29.595 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRA/sra Выходные данные: SRR12432354.sra 932.8 Mб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 4 сентября 2022 № 17 ( ) не заполняется 2.1. Наименование виртуальной машины: illumina 2.2. Конфигурация машины: Intel Ice Lake (Yandex.Cloud) 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 4 сентября 2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 SRR12432354 Время выполнения: 1 минут 2.421 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR12432354 Выходные данные: SRR12432354_1.fastq 2.95 Гб SRR12432354_2.fastq 2.95 Гб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR12432354_1.fastq conda deactivate Время выполнения:  0 минут 51.222 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR12432354 Выходные данные: SRR12432354_1_fastqc.html 555 Кб SRR12432354_1_fastqc.zip 355 Кб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR12432354_2.fastq conda deactivate Время выполнения: 0 минут 50.250 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR12432354 Выходные данные: SRR12432354_2_fastqc.html 558 Кб SRR12432354_2_fastqc.zip 358 Кб Команда: trimmomatic Параметры: conda activate trimmomatic time trimmomatic PE -threads 64 -phred33 SRR12432354_1.fastqSRR12432354_2.fastq SRR12432354_1_1P.fq.gz SRR12432354_1_1U.fq.gz  SRR12432354_2_2P.fq.gzSRR12432354_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 conda deactivate Время выполнения: 3 минут 37.245 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR12432354 Выходные данные: SRR12432354_1_1P.fq.gz 522 Мб SRR12432354_1_1U.fq.gz 9.69 Мб SRR12432354_2_2P.fq.gz 588 Мб SRR12432354_2_2U.fq.gz 650 Кб Команда: spades Параметры: time /home/illumina/mydevice/SPAdes-3.14.1-Linux/bin/spades.py -t 64 --pe-1 1 SRR12432354_1_1P.fq.gz --pe-2 1 SRR12432354_2_2P.fq.gz -o spadesSRR12432354 Время выполнения: 363 минут 35.491 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR12432354/spadesSRR12432354 Выходные данные: contigs.fasta 31.8 Гб Другие папки и файлы: pipeline_state tmp misc K127 K99 K77 K55 K33 K21 corrected warnings.log spades.log scaffolds.paths scaffolds.fasta contigs.paths contigs.fasta before_rr.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 1.94 Гб Команда: quast Параметры: time python /home/illumina/mydevice/quast-5.0.2/quast.py -t 64 -o /home/illumina/mydevice/a.krokhina/quast/ --pe1 /home/illumina/mydevice/a.krokhina/SRR12432354_1_1P.fq.gz --pe2 /home/illumina/mydevice/a.krokhina/SRR12432354_2_2P.fq.gz /home/illumina/mydevice/a.krokhina/spadesSRR12432354/contigs.fasta Время выполнения: 0 минут 10.538 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR12432354/QUAST Выходные данные: report.pdf 30.2 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.38 Мб Команда: busco Параметры: time busco -i /mnt/vdb1/SRR12432354/spadesSRR12432354/contigs.fasta -l /mnt/vdb1/insecta_odb10/ -o busco -m genome -f --offline -c 64 Время выполнения: 10 минут 39.695 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR12432354/busco Выходные данные: full_table.tsv 36.0 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 107 Мб Команда: prodigal Параметры: source ~/.bashrc conda activate prodigal cd SRR12432354 time prodigal -i /mnt/vdb1/SRR12432354/spadesSRR12432354/contigs.fasta -a queriesSRR12432354.faa conda deactivate Время выполнения: 0 минут 3.768 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR12432354/ Выходные данные: SRR12432354.faa 16.8 Мб Команда: diamond Параметры: conda activate diamond time diamond blastp -d /mnt/vdb1/P450_diamond_db_aug2022.dmnd -q queriesSRR12432354.faa -o matches_p.tsv --threads 64 --outfmt 6 conda deactivate cd .. Время выполнения: 0 минут 0.770304 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR12432354/ Выходные данные: matches_pSRR12432354.tsv 32.2 Кб Обработка проведена: Лаборант Крохина А. Е. Протокол проверен: П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 6 сентября 2022 № 18 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина illumina (Yandex.Cloud) Рабочий диск vdb1 Папка назначения /mnt/vdb1/SRA/sra 1.2. Место назначения для загрузки адрес виртуальной машины динамический название монтированного сетевого диска: vdb1 папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR12626143/SRR12626143 формат исходных данных /mnt/vdb1/SRA/sra объем исходных данных 98.3 Мб 1.3. Проведение копирования Команда: prefetch  Параметры: export PATH=$PATH:$PWD/sratoolkit.3.0.0-ubuntu64/bin/ time prefetch SRR12626143 Время выполнения: 1 минут 11.728 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRA/sra Выходные данные: SRR12626143.sra 98.3 Mб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 6 сентября 2022 № 18 ( ) не заполняется 2.1. Наименование виртуальной машины: illumina 2.2. Конфигурация машины: Intel Ice Lake (Yandex.Cloud) 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 6 сентября 2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 SRR12626143 Время выполнения: 0 минут 4.261 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR12626143 Выходные данные: SRR12626143_1.fastq 225 Мб SRR12626143_2.fastq 226 Мб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR12626143_1.fastq conda deactivate Время выполнения: 0 минут 7.224 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR12626143 Выходные данные: SRR12626143_1_fastqc.html 664 Кб SRR12626143_1_fastqc.zip 322 Кб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR12626143_2.fastq conda deactivate Время выполнения: 0 минут 9.342 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR12626143 Выходные данные: SRR12626143_2_fastqc.html 656 Кб SRR12626143_2_fastqc.zip 321 Кб Команда: trimmomatic Параметры: conda activate trimmomatic time trimmomatic PE -threads 64 -phred33 SRR12626143_1.fastqSRR12626143_2.fastq SRR12626143_1_1P.fq.gz SRR12626143_1_1U.fq.gz  SRR12626143_2_2P.fq.gzSRR12626143_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 conda deactivate Время выполнения: 0 минут 19.730 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR12626143 Выходные данные: SRR12626143_1_1P.fq.gz 49.2 Мб SRR12626143_1_1U.fq.gz 3.33 Мб SRR12626143_2_2P.fq.gz 58.6 Мб SRR12626143_2_2U.fq.gz 503 Кб Команда: spades Параметры: time /home/illumina/mydevice/SPAdes-3.14.1-Linux/bin/spades.py -t 64 --pe-1 1 SRR12626143_1_1P.fq.gz --pe-2 1 SRR12626143_2_2P.fq.gz -o spadesSRR12626143 Время выполнения: 11 минут 20.965 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR12626143/spadesSRR12626143 Выходные данные: contigs.fasta 2.39 Мб Другие папки и файлы: pipeline_state tmp misc K127 K99 K77 K55 K33 K21 corrected warnings.log spades.log scaffolds.paths scaffolds.fasta contigs.paths contigs.fasta before_rr.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 158 Мб Команда: quast Параметры: time python /home/illumina/mydevice/quast-5.0.2/quast.py -t 64 -o /home/illumina/mydevice/a.krokhina/quast/ --pe1 /home/illumina/mydevice/a.krokhina/SRR12626143_1_1P.fq.gz --pe2 /home/illumina/mydevice/a.krokhina/SRR12626143_2_2P.fq.gz /home/illumina/mydevice/a.krokhina/spadesSRR12626143/contigs.fasta Время выполнения: 0 минут 1.298 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR12626143/QUAST Выходные данные: report.pdf 35.2 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.37 Мб Команда: busco Параметры: time busco -i /mnt/vdb1/SRR12626143/spadesSRR12626143/contigs.fasta -l /mnt/vdb1/insecta_odb10/ -o busco -m genome -f --offline -c 64 Время выполнения: 2 минут 12.580 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR12626143/busco Выходные данные: full_table.tsv 54.6 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 103 Мб Команда: prodigal Параметры: source ~/.bashrc conda activate prodigal cd SRR12626143 time prodigal -i /mnt/vdb1/SRR12626143/spadesSRR12626143/contigs.fasta -a queriesSRR12626143.faa conda deactivate Время выполнения: 0 минут 1.2140 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR12626143/ Выходные данные: SRR12626143.faa 1.15 Мб Команда: diamond Параметры: conda activate diamond time diamond blastp -d /mnt/vdb1/P450_diamond_db_aug2022.dmnd -q queriesSRR12626143.faa -o matches_p.tsv --threads 64 --outfmt 6 conda deactivate cd .. Время выполнения: 0 минут 0.068368 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR12626143/ Выходные данные: matches_pSRR12626143.tsv 0 Мб Обработка проведена: Лаборант Крохина А. Е. П Р О Т О К О Л ( х ) загрузки ( x ) обработки ( ) выгрузки данных Дата: 4 сентября 2022 № 19 1. ЗАГРУЗКА ИСХОДНЫХ ДАННЫХ 1.1. Размещение исходных данных Виртуальная машина illumina (Yandex.Cloud) Рабочий диск vdb1 Папка назначения /mnt/vdb1/SRA/sra 1.2. Место назначения для загрузки адрес виртуальной машины динамический название монтированного сетевого диска: vdb1 папка с исходными данными https://sra-pub-run-odp.s3.amazonaws.com/sra/SRR12626150/SRR12626150 формат исходных данных .sra объем исходных данных 21.6 Мб 1.3. Проведение копирования Команда: prefetch  Параметры: export PATH=$PATH:$PWD/sratoolkit.3.0.0-ubuntu64/bin/ time prefetch SRR12626150 Время выполнения: 0 минут 7.590 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRA/sra Выходные данные: SRR12626150.sra 21.6 Мб 2. ОБРАБОТКА ДАННЫХ ( x ) Протокол загрузки данных от 4 сентября 2022 № 19 ( ) не заполняется 2.1. Наименование виртуальной машины: illumina 2.2. Конфигурация машины: Intel Ice Lake (Yandex.Cloud) 2.3. Компьютер для запуска терминала: ПК оператора, Windows 10 2.4. Терминал обращения к ВМ: PuTTY 2.5. Реквизиты СОП-АКОД: (а) наименование: «Обработка данных illumina жуков-стафилинид» (б) дата 4 сентября 2022 (в) версия 1 2.6. Запуск команд: Команда: fastq-dump Параметры: time fastq-dump --split-3 SRR12626150 Время выполнения: 0 минут 29.563 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR12626150 Выходные данные: SRR12626150_1.fastq 74.3 Мб SRR12626150_2.fastq 73.5 Мб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR12626150_1.fastq conda deactivate Время выполнения: 0 минут 4.231 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR12626150 Выходные данные: SRR12626150_1_fastqc.html 246 Кб SRR12626150_1_fastqc.zip 272 Кб Команда: fastqc Параметры: conda activate fastqc time fastqc --extract -f fastq -c SRR12626150_2.fastq conda deactivate Время выполнения: 0 минут 4.233 секунд   Размещение выходных файлов (папка): /mnt/vdb1/SRR12626150 Выходные данные: SRR12626150_2_fastqc.html 241 Кб SRR12626150_2_fastqc.zip 266 Кб Команда: trimmomatic Параметры: conda activate trimmomatic time trimmomatic PE -threads 64 -phred33 SRR12626150_1.fastqSRR12626150_2.fastq SRR12626150_1_1P.fq.gz SRR12626150_1_1U.fq.gz  SRR12626150_2_2P.fq.gzSRR12626150_2_2U.fq.gz LEADING:10 SLIDINGWINDOW:0:20 MINLEN:36 AVGQUAL:24 conda deactivate Время выполнения: 0 минут 7.321 секунд   Размещение выходных файлов (папка): /mnt/vdb1/SRR12626150 Выходные данные: SRR12626150_1_1P.fq.gz 13.7 Мб SRR12626150_1_1U.fq.gz 108 Кб SRR12626150_2_2P.fq.gz 14.0 Мб SRR12626150_2_2U.fq.gz 43.7 Кб Команда: spades Параметры: time /home/illumina/mydevice/SPAdes-3.14.1-Linux/bin/spades.py -t 64 --pe-1 1 SRR12626150_1_1P.fq.gz --pe-2 1 SRR12626150_2_2P.fq.gz -o spadesSRR12626150 Время выполнения: 2 минут 46.442 секунд  Размещение выходных файлов (папка): /mnt/vdb1/SRR12626150/spadesSRR12626150 Выходные данные: contigs.fasta 45.9 Кб Другие папки и файлы: pipeline_state tmp misc K127 K99 K77 K55 K33 K21 corrected warnings.log spades.log scaffolds.paths scaffolds.fasta contigs.paths contigs.fasta before_rr.fasta assembly_graph_with_scaffolds.gfa assembly_graph_after_simplification.gfa assembly_graph.fastg run_spades.yaml run_spades.sh params.txt input_dataset.yaml dataset.info 28.7 Мб Команда: quast Параметры: time python /home/illumina/mydevice/quast-5.0.2/quast.py -t 64 -o /home/illumina/mydevice/a.krokhina/quast/ --pe1 /home/illumina/mydevice/a.krokhina/SRR12626150_1_1P.fq.gz --pe2 /home/illumina/mydevice/a.krokhina/SRR12626150_2_2P.fq.gz /home/illumina/mydevice/a.krokhina/spadesSRR12626150/contigs.fasta Время выполнения: 0 минут 21.560 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR12626150/QUAST Выходные данные: report.pdf 28.9 Кб Другие папки и файлы: icarus_viewers basic_stats report.pdf report.html quast.log icarus.html transposed_report.txt transposed_report.tsv transposed_report.tex report.txt report.tsv report.tex 1.26 Мб Команда: busco Параметры: time busco -i /mnt/vdb1/SRR12626150/spadesSRR12626150/contigs.fasta -l /mnt/vdb1/insecta_odb10/ -o busco -m genome -f --offline -c 64 Время выполнения: 0 минут 49.005 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR12626150/busco Выходные данные: full_table.tsv 29.6 Кб Другие папки и файлы: logs run_ short_summary.specific..busco.txt 105 Мб Команда: prodigal Параметры: source ~/.bashrc conda activate prodigal cd SRR12626150 time prodigal -i /mnt/vdb1/SRR12626150/spadesSRR12626150/contigs.fasta -a queriesSRR12626150.faa conda deactivate Время выполнения: 0 минут 2.310 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR12626150/ Выходные данные: SRR12626150.faa 21.7 Кб Команда: diamond Параметры: conda activate diamond time diamond blastp -d /mnt/vdb1/P450_diamond_db_aug2022.dmnd -q queriesSRR12626150.faa -o matches_p.tsv --threads 64 --outfmt 6 conda deactivate cd .. Время выполнения: 0 минут 0.105 секунд Размещение выходных файлов (папка): /mnt/vdb1/SRR12626150/ Выходные данные: matches_pSRR12626150.tsv 0 Мб Обработка проведена: Лаборант Крохина А. Е.