Effecten van N-terminus gemodificeerde Hx-amiden op DNA-bindingsaffiniteit, sequentiespecificiteit, cellulaire opname en genexpressie
Vijf X-HxIP (Hx-amiden) 6a-e, waarin de N-terminus p-anisylgroep is gemodificeerd, zijn ontworpen en gesynthetiseerd met als doel de DNA-binding te optimaliseren, de cellulaire opname/nucleaire penetratie te verbeteren en de modulatie van de topoisomerase IIα (TOP2A) genexpressie. De modificaties omvatten een fluorfenylgroep en andere heterocycli die verschillende moleculaire vormen, grootte en polariteit dragen. Web als hun moederverbinding HxIP 3 binden alle vijf X-HxIP-analogen bij voorkeur aan hun verwante sequentie 5′-TACGAT-3′, die wordt gevonden ingebed op de 5′-flank van de omgekeerde CCAAT-box-2 (ICB2) -site in de TOP2A genpromoter, en remt eiwitcomplexbinding, zoals blijkt uit een celvrij systeem. Interessant is dat de 4-pyridylanaloog 6a vertoont:grotere bindingsaffiniteit voor de doel-DNA-sequentie en schaft de eiwit:ICB2-interactie in vitro af, bij een lagere concentratie, vergeleken met de prototypische verbinding HxIP 3.
Analogons 6b-e vertonen verbeterde DNA-sequentiespecificiteit , maar verminderde bindingsaffiniteit voor de verwante sequentie, ten opzichte van het niet-gemodificeerde HxIP 3, waarbij polyamiden 6b en 6e het meest sequentieselectief zijn. In tegenstelling tot Three en 6b was 6a echter niet in staat om cellen binnen te gaan, toegang te krijgen tot de kern en daardoor de TOP2A-genexpressie in samenvloeiende menselijke longkankercellen te beïnvloeden. Deze resultaten laten zien dat hoewel DNA-bindingsaffiniteit en sequentieselectiviteit belangrijk zijn, rekening houden met cellulaire opname en concentratie in de kern van cruciaal belang is wanneer het uitoefenen van biologische activiteit het gewenste resultaat is. Door de DNA-binding, cellulaire opname en gen regulerende eigenschappen van deze kleine moleculen, kunnen we de determinanten van de opgewekte biologische activiteit ophelderen, die kan worden beïnvloed door zelfs kleine structurele modificaties in het moleculaire ontwerp van polyamide.
SSG-LUGIA: op één sequentie gebaseerd genoomniveau zonder toezicht genomisch eilandvoorspellingsalgoritme
Achtergrond: Genomic Islands (GI’s) zijn clusters van genen die worden gemobiliseerd door horizontale genoverdracht. GI’s spelen een cruciale rol in de evolutie van bacteriën als een mechanisme van diversificatie en aanpassing aan verschillende niches. Daarom is identificatie en karakterisering van GI’s in bacteriële genomen belangrijk voor het begrijpen van bacteriële evolutie. Het kwantificeren van GI’s is echter inherent moeilijk, en de bestaande methoden hebben te lijden van een lage voorspellingsnauwkeurigheid en een wisselwerking tussen precisie en herinnering. Bovendien staan verschillende van hen onder toezicht van aard, en dus zijn hun toepassingen op nieuw gesequeneerde genomen doorzeefd met hun afhankelijkheid van de functionele annotatie van bestaande genomen.
Resultaten: We presenteren SSG-LUGIA, een volledig geautomatiseerde en niet-gecontroleerde benadering voor het identificeren van GI’s en horizontaal overgedragen genen. SSG-LUGIA is een nieuwe methode die is gebaseerd op een niet-gecontroleerde anomaliedetectietechniek, vergezeld van verdere verfijning met behulp van aanwijzingen uit de literatuur over signaalverwerking. SSG-LUGIA maakt gebruik van de atypische compositievooroordelen van de buitenaardse genen om GI’s in prokaryotische genomen te lokaliseren. SSG-LUGIA werd beoordeeld op een grote benchmark-dataset `IslandPick’ en op een reeks van 15 goed bestudeerde genomen in de literatuur en gevolgd door een grondige analyse van het goed begrepen Salmonella typhi CT18-genoom. Verder werd de werkzaamheid van SSG-LUGIA bij het identificeren van horizontaal overgedragen genen geëvalueerd op twee aanvullende bacteriële genomen, namelijk die van Corynebacterium diphtheria NCTC13129 en Pseudomonas aeruginosa LESB58.
Conclusies: Onze resultaten geven aan dat SSG-LUGIA superieure prestaties behaalde in vergelijking met veelgebruikte bestaande methoden. Belangrijk is dat het een betere afweging opleverde tussen precisie en terugroepactie dan de bestaande methoden. De niet-afhankelijkheid van de functionele annotatie van genomen maakt het geschikt voor het analyseren van nieuw gesequenced, maar niet-gekarakteriseerde genomen.
Het toepassen van frequentiechaosspelrepresentatie met perceptuele beeldhashing op fylogenetische analyses van gensequenties
Als een zeer belangrijke onderzoeksrichting op het gebied van bio-informatica speelt sequentie-uitlijning een vitale rol in het onderzoek en de ontwikkeling van de biologie. Het omzetten van genoomsequenties naar grafieken met behulp van frequentiechaosspelrepresentatie (FCGR) is een uitstekende technologie voor het in kaart brengen van gensequenties, die rijke genetische informatie kan opslaan in FCGR-afbeeldingen. Voor elk FCGR-beeld construeren we de perceptual picture hashing (PIH) -matrix met behulp van de bicubische interpolatiezoom. Het verschil van de perceptuele hash-matrix van elke twee afbeeldingen wordt berekend en de clusteringsafstand van de overeenkomstige twee gensequenties wordt weergegeven door de verschillen van de perceptuele hash-matrix.
In dit artikel hebben we verschillende typische genoomsequentiedatasets uitgelijnd en geanalyseerd, waaronder mitochondriale genen van zoogdieren, humaan immunodeficiëntievirus 1 (HIV-1) en hepatitis E-virus (HEV) om hun evolutionaire bomen te bouwen. Experimentele resultaten toonden aan dat onze PIH-combinerende FCGR-methode (FCGR-PIH) een vergelijkbare classificatienauwkeurigheid heeft als de klassieke Clustal W-sequentie-uitlijningsmethode. Verder werden 25 full mitochondriale DNA-sequenties van cichlidenvissen en 27 Escherichia coli/Shigella volledige genoomsequenties geselecteerd uit het AFproject-testplatform voor exams. De ranglijst van prestatiebenchmarks demonstreert de effectiviteit van het FCGR-PIH- algoritme en zijn potentieel voor grootschalige genoomsequentie-analyse.
STR’s: oude architecturen van het genoom voorbij de sequentie
Korte tandemherhalingen (STR’s) worden gewoonlijk gedefinieerd als korte runs van repetitieve nucleotiden, bestaande uit tandem herhalende motiefeenheden van 2-6 bp, die overal in het genoom zijn verspreid. Functionele STR’s zijn polymorf in de populatie en hun variaties beïnvloeden genexpressie, wat vervolgens kan resulteren in pathogene fenotypes. Om STR-fenotypische effecten en hun functionele rollen te begrijpen, beschrijven we vier verschillende mutatiemechanismen, waaronder het ongelijke oversteekmodel, genconversie, retrotranspositiemechanisme en replicatie-slippage.
Vanwege de multi-allelische aard, kleine lengte, overvloed, hoge variabiliteit , codominante overerving, bijna neutrale evolutie, uitgebreide genoomdekking en eenvoudige analyse van STR’s, worden deze markers veel gebruikt in verschillende soorten biologisch onderzoek, waaronder populatiegenetica-onderzoeken, genoom mapping, moleculaire epidemiologie, vaderschapsanalyse en gene move research. In deze evaluate richten we ons op de huidige kennis met betrekking tot STR-genomische distributie , functie, mutatie en toepassingen.
Ontwikkeling en toepassing van een snelle methode om de nauwkeurige volledige genoomsequenties van menselijke adenovirussen te verkrijgen
De whole-genome sequencing (WGS) van humane adenovirussen (HAdV’s) speelt een belangrijke rol bij het identificeren, typeren en mutatie-analyse van HAdV’s. Tegenwoordig zijn er drie generaties sequencing ontwikkeld. De nauwkeurigheid van sequencing van de eerste generatie is tot 99,99%, terwijl deze technologie afhankelijk is van PCR en tijdrovend is ; de next-generation sequencing (NGS) is duur en niet kosteneffectief voor het bepalen van een paar speciale monsters; en de sequencing-technologie van de derde generatie heeft een hoger foutenpercentage. In deze studie hebben we eerst een efficiënte HAdV genomische DNA-extractiemethode ontwikkeld.
Met behulp van het volledige genomische DNA in plaats van de PCR-amplicons als de sjabloon voor directe sequencing en een set wandelende primers, hebben we de HAdV WGS-methode ontwikkeld op foundation van sequencing van de eerste generatie. De HAdV-hele genomen werden effectief gesequenced door een set van eenrichtings-sequencing-primers ontworpen, waardoor de sequencing-tijd en -kosten werden verminderd. Wat nog belangrijker is, is dat een hoge sequentienauwkeurigheid wordt gegarandeerd. Vier HAdV-stammen (GZ01, GZ02, HK35 en HK91) werden geïsoleerd uit kinderen met acute luchtwegaandoeningen (ARD’s) en de volledige genomen werden gesequenced met behulp van deze methode. De nauwkeurige sequenties van de hele omgekeerde terminale herhalingen (ITR’s) aan beide uiteinden van de HAdV-genomen werden ook verkregen.
De genoomsequentie van humaan adenovirus sort 14 (HAdV-B14) stam GZ01 die met deze methode is verkregen, is identiek aan de sequentie die is vrijgegeven in GenBank, wat aangeeft dat deze nieuwe sequentiemethode een hoge nauwkeurigheid heeft. De vergelijkende genomische analyse identificeerde dat de in september 2010 geïsoleerde stam GZ02 dezelfde genoomsequentie had als de HAdV-B14-stam GZ01 (oktober 2010). Daarom is stam GZ02 het eerste HAdV-B14-isolaat dat in China opduikt (september 2010; GenBank acc nr. MW692349). De WGS van HAdV-C2-stam HK91 en HAdV-E4-stam HK35 geïsoleerd uit kinderen met acute luchtwegaandoeningen in Hong Kong werden ook bepaald met deze sequentiemethode. Kortom, deze WGS-methode is snel, nauwkeurig en universeel voor gewone menselijke adenovirussoorten B, C en E.De sequentiestrategie kan ook worden toegepast op de WGS van de andere DNA-virussen.