标签:bioinformatics
-
使用python / selenium保存完整的网页(包括CSS,图像) - python
我正在使用Python / Selenium将遗传序列提交到在线数据库,并希望保存返回的完整页面。以下是使我获得所需结果的代码: from selenium import webdriver URL = 'https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastx&PAGE_TYPE=Bl […]
-
如何使内循环考虑外循环的每次迭代? - python
由'A', 'U', 'G' or 'C'组成的三字母集定义为密码子。每个密码子对应20个字母之一。这些字母(氨基酸)的集合定义为蛋白质。文件“ codons.txt”包含密码子和相应的字母。 接下来的问题是:内部for循环仅工作一次-它仅将txt文件中的行与第一个密码子进行比较 […]
-
FASTQC在命令行上运行,但不在python子进程中运行(Java异常) - java
从Linux命令行调用它时,我使用的命令行工具工作正常,但是当我通过Python subprocess模块调用它时,会出现异常。我看了以前与此相关的文章,但是没有一篇文章讨论它如何在命令行上工作,但在Python中却没有。 这是我得到的回溯示例: Exception in thread "Thread-1" java.lang.Error […]
-
从排序数据中解析信息 - python
我有一个txt文件,该文件是经过转换的fasta文件,只是具有我要分析的特定区域。看起来像这样 CTGGCCGCGCTGACTCCTCTCGCT CTCGCAGCACTGACTCCTCTTGCG CTAGCCGCTCTGACTCCGCTAGCG CTCGCTGCCCTCACACCTCTTGCA CTCGCAGCACTGACTCCTCTTGCG CTCGCAG […]
-
使用python中指定的分隔符逐块读取文件 - python
我有一个这样的input_file.fa文件(FASTA格式): > header1 description data data data >header2 description more data data data 我想一次在文件中读取一个块,以便每个块包含一个标头和相应的数据,例如区块1: > header1 description […]
-
如何立即将所有Snakemake作业提交到Slurm Cluster - python
我正在使用snakemake构建可在SLURM群集上运行的变体调用管道。集群具有登录节点和计算节点。任何真正的计算都应以srun或sbatch作业的形式在计算节点上完成。作业最多只能运行48小时。我的问题是,处理许多样本(尤其是在队列繁忙时)将花费48小时以上的时间来处理每个样本的所有规则。传统的snakemake群集执行使主线程运行,该主线程仅在所有规则的 […]
-
在UniProt的正则表达式搜索中添加蛋白质代码作为标识符 - python
我用我感兴趣的蛋白质序列从UniProt处获得了关闭的文件,现在我希望从文件中提取/保存跨膜区域的位置。 该文件看起来像这样 O75581 UniProtKB Topological domain 1394 1613 . . . Note=Cytoplasmic;Ontology_term=ECO:0000255;evidence=ECO:0000255 O […]